宗成慶,有關計算機領域的自然語言處理方面最權威的書是什么

1,有關計算機領域的自然語言處理方面最權威的書是什么計算機自然語言處理是一個前沿領域,有很多問題還沒有根本解決,要了解最新進展最好看論文 。書中一般只講一些常用的技術和模型,而且基本沒有哪本書能把所有的技術都能詳細地講到,所以沒有哪本書是絕對權威的,看你想了解哪方面 。幾本比較好的書:國外的:統計自然語言處理基礎(書店有中文版,網上有英文電子版)作者:(美)(Manning Christopher D.)(德)(Schutze Hinrich) 譯者:苑春法自然語言處理綜論(美國 朱夫斯凱)國內的:統計自然語言處理(宗成慶)自然語言處理(江銘虎)計算機自然語言處理(王曉龍 關毅)

宗成慶,有關計算機領域的自然語言處理方面最權威的書是什么


2,宗成慶的介紹宗成慶 1998年3月畢業于中國科學院計算技術研究所,獲博士學位,1998年5月至2000年4月在中國科學院自動化研究所模式識別國家重點實驗室從事博士后研究,出站后留實驗室工作至今,現為模式識別國家重點實驗室研究員,博士生導師 。
宗成慶,有關計算機領域的自然語言處理方面最權威的書是什么


3,如何評價中國科學院自動化研究所的宗成慶老師我只這里的學生,嘿嘿 。以我的角度看,工作人員,老師等等都相處的很融洽 ??蒲袑嵙ν柡Φ模袃蓚€國家重點實驗室 。員工福利就不太清楚了 。【宗成慶,有關計算機領域的自然語言處理方面最權威的書是什么】
宗成慶,有關計算機領域的自然語言處理方面最權威的書是什么


4,自然語言處理怎么最快入門我看了好幾遍《致謝》,甚為感動 。從農村、大山里走出來的寒門子弟,能勵志成才報效祖國,必將激勵一代又一代年輕人!古有顏回之樂 ?!耙缓勈?,一瓢飲,在陋巷 。人不堪其憂,回也不改其樂 。賢哉回也!”,后有王陽明的龍場悟道 ?!爸喒冽垐觯右奶幚?,動心忍性之余,恍若有悟,體驗探求,再更寒暑,證諸五經、四子,沛然若決江河而放諸海也 。然后嘆圣人之道坦如大路 ?!边@些史學教育著我們,不管環境有多惡劣,生活有多艱辛,崇尚修齊治平的抱負和理想不能丟 。有過相同的經歷,一些感悟不得不共鳴:一是,真心希望天下有學,不因客觀原因而夭折了希望之星,未來人才 。二是,正向激勵莘莘學子,珍惜來之不易的學習環境,努力成為國之棟梁 。三是,推動社會援學助學,社會應更多地去關心愛護每一個孩子,讓其健康快樂成長 。四是,完善社會托底機制,別讓求學中的孩子們過多過早來承受不能承受之痛 。五是,常懷感恩勿需怨天,時代造就人才,時勢成就英雄 。走過風雨的人,更能堅定人生信念 。我看了好幾遍《致謝》,甚為感動 。從農村、大山里走出來的寒門子弟,能勵志成才報效祖國,必將激勵一代又一代年輕人!古有顏回之樂 。“一簞食,一瓢飲,在陋巷 。人不堪其憂,回也不改其樂 。賢哉回也!”,后有王陽明的龍場悟道 ?!爸喒冽垐觯右奶幚?,動心忍性之余,恍若有悟,體驗探求,再更寒暑,證諸五經、四子,沛然若決江河而放諸海也 。然后嘆圣人之道坦如大路 ?!边@些史學教育著我們,不管環境有多惡劣,生活有多艱辛,崇尚修齊治平的抱負和理想不能丟 。有過相同的經歷,一些感悟不得不共鳴:一是,真心希望天下有學,不因客觀原因而夭折了希望之星,未來人才 。二是,正向激勵莘莘學子,珍惜來之不易的學習環境,努力成為國之棟梁 。三是,推動社會援學助學,社會應更多地去關心愛護每一個孩子,讓其健康快樂成長 。四是,完善社會托底機制,別讓求學中的孩子們過多過早來承受不能承受之痛 。五是,常懷感恩勿需怨天,時代造就人才,時勢成就英雄 。走過風雨的人,更能堅定人生信念 。非科班出身,自學擼出中文分詞庫HanLP,在GitHub標星1.5萬,成為最受歡迎的自然語言處理項目 。他將學習經驗總結成書《自然語言處理入門》,幫助小白快速入門NLP 。針對題主的提問,HanLP自然語言處理類庫的開發者何晗的經驗很值得借鑒 。截至 2019 年 11月初,HanLP項目在 GitHub Star 數達到了 15.6 K,超過了賓夕法尼亞大學的 NLTK、斯坦福大學的 CoreNLP 。貼上GitHub地址:https://github.com/hankcs/HanLP何晗在開發這款 NLP 工具包時,還是上海外國語大學一名日語專業的大二學生,HanLP項目脫胎他大學時接的一份兼職,何晗也因緣從一個非科班專業的小白逐步成長為NLP領域的專家 。如今,正在攻讀CS博士的他(研究方向:句法分析、語義分析與問答系統),結合自己的學習歷程和HanLP的開發經驗創作出版了《自然語言處理入門》一書,得到了周明、劉群、王斌等業內頂級 NLP 專家的推薦 。從著手開發HanLP,到HanLP達到工業使用的水準,何晗對自學NLP有深刻的見解 。如果用一句話來總結,那就是:自頂而下,從工程去切入,由應用層往下面的基礎層拓展,遞歸補充理論知識,才能事半功倍 。以下入門NLP的建議,皆來自于何晗的經驗,分享給像題主這樣的初學者,希望能對大家有所啟發 。一、初學者,請避開自學NLP的常見誤區有的初學者排斥基礎理論——認為學校教的都是沒用的,公司里都用不到;有的初學者對基礎理論敬而遠之——認為理論太高深了,自己基礎不好,學了也白學;有的初學者,特別是已經工作的程序員,基本方向正確但學習路徑錯誤,比較容易走極端:在工作很忙的情況下,只是抱著經典書籍苦啃,直到筋疲力盡項目也毫無進展,從而喪失了學習NLP的興趣;或者,俗稱調庫小能手,跟風潮流,缺少理論基礎,缺乏獨立思考能力(比如,認為深度學習最牛,其他的基礎理論都是垃圾;認為CNN/RNN/BERT會調參就行了) 。而實際上,自然語言處理是計算機科學、人工智能和語言學學科的交集,這三方面的學科知識都是需要儲備的,基礎理論的學習必不可少 。但很多初學者都是在工作之后才入坑NLP,既難以靜下心來啃書啃課,又缺少很好的老師傳授知識經驗 。所以,有效可行的入門方式就是從工程切入,遵循這樣的邏輯:延遲加載,只在使用的時候才去加載必要的資料:你首先看到的是一個摸得著的實際問題,為了解決該問題才去接觸一個具體的方案;為了理解這個方案,才會引入必要的背景知識;為了實現這個方案,才會引入相關細節;為了克服這個方案的問題,才會過渡到新的方案 。二、想快速入門NLP,邊學邊做療效好何晗入門NLP,讀過的經典書有:《統計自然語言處理》(宗成慶 著)(對應語言學知識)、《統計學習方法》(李航 著)(對應人工智能知識),《挑戰程序設計競賽》(秋葉拓哉、鹽田陽一、北川宜稔 著)(對應計算機算法知識) 。不過,在看經典書籍的過程中,他發現,學習自然語言處理并不需要完全把這幾本書看透,最好是可以邊看書邊做項目 。這些書都是非常牛的好書,然而可惜的是,看完書中的章節,不知該如何應用其中的知識點,即使實現了文章中提到的模型,也很難直接將其運用于工程項目 。想必很多初學者都面臨類似的學習困惑 。為了解決這個問題,何晗動手寫了《自然語言處理入門》,目的就是希望學習者看完一章后,便可以將知識點直接用于項目,適合NLP初學者入門并快速布置到生產環境中 。成效快,痛苦小,疑問少 。何晗在《自然語言處理入門》一書中,以自己的HanLP開源項目為案例,代碼對照公式講解每一個算法每一個模型,讓入門者帶著工程思維理解NLP的知識要點,試圖在目前市面上艱深晦澀的教科書和簡單的入門書之間作出平衡 。《自然語言處理入門》帶領學習者從基本概念入手 。逐步介紹中文分詞、詞性標注、命名實體識別、信息抽取、文本聚類、文本分類、句法分析這幾個熱門問題的算法原理和工程實現 。通過對多種算法的講解和實現,比較各自的優缺點和適用場景 。這些實現并非教學專用,而是生產級別的成熟代碼,可以直接用于實際項目 。在理解這些熱門問題的算法后,這本書會引導學習者根據自己的項目需求拓展新功能,最終達到理論和實踐上的同步入門 。何晗認為,NLP的學習路徑,應該尊重一般人的認知規律,而不是學術上的綱目順序,以此為宗旨來編排圖書的內容 。因此,面向普通程序員,這本書內容分為以下三大部分:第一部分介紹一些字符串算法,讓普通程序員從算法的角度思考中文信息處理 。第二部分由易到難地講解一些常用的機器學習模型,讓算法工程師晉級為機器學習工程師 。由中文分詞貫穿始終,構成一種探索式的遞進學習 。這些模型也并非局限于中文分詞,會在第三部分應用到更多的自然語言處理問題上去 。第三部分新增了許多與文本處理緊密相關的算法,讓機器學習工程師進化到自然語言處理工程師 。特別地,最后一章介紹了當前流行的深度學習方法,起到擴展視野、承上啟下的作用 。學習者可根據自身情況,靈活跳過部分章節 。何晗在自學過程中走過不少彎路,深知數學語言的艱深晦澀,并且痛恨羅列公式故作高深的文章,所以他在書中只保留了必不可少的公式和推導,并且公式與代碼相互印證 。配套代碼由Java和Python雙語言寫成,與GitHub上最新代碼同步更新,所以你只要具備基本的編程經驗,就可以跟隨書本零起點入門 。此外,何晗還總結出一份最為詳盡的NLP+ML“雙生樹”思維導圖,導圖中的關聯知識點不僅涵蓋NLP領域的核心知識,甚至涉及許多前沿研究和應用,印刷尺寸寬60cm,高74cm,隨書附贈供學習者參考 。三、進階NLP的學習資料和工具推薦推薦讀這些經典書籍:多讀論文,推薦用Google Scholar和Papers檢索:克服語言障礙,推薦用歐路詞典:追蹤前沿動態,推薦NLP-progress,在各項NLP任務上的排行榜網址:https://nlpprogress.com/一個中肯的建議:NLP沒有通用的解法,算法不夠,語料來補算法不是萬能的 。(想想:一兩個百分點對實際業務有多少幫助,又增加了多少成本?)不要完全相信論文 。(a. 不要相信不公開源代碼的論文; b. 不要相信公開源代碼但數據預處理作假的論文; c. 即使能跑出作者宣稱的分數,請考慮:模型是否能泛化到你的行業領域? 又增加了多少成本?)語料極其重要 。(a. 語料幾乎可以把準確率提升到你期望的任何水準,只要數量質量足夠; b. 目前通用語料幾乎都是新聞,誰能標注出行業語料,誰就是大王; c. 深度學習時代,無標注的純文本語料也大有用場;d. 軟件工程2.0:用數據編程 。)我看了好幾遍《致謝》,甚為感動 。從農村、大山里走出來的寒門子弟,能勵志成才報效祖國,必將激勵一代又一代年輕人!古有顏回之樂 。“一簞食,一瓢飲,在陋巷 。人不堪其憂,回也不改其樂 。賢哉回也!”,后有王陽明的龍場悟道 ?!爸喒冽垐?,居夷處困,動心忍性之余,恍若有悟,體驗探求,再更寒暑,證諸五經、四子,沛然若決江河而放諸海也 。然后嘆圣人之道坦如大路 ?!边@些史學教育著我們,不管環境有多惡劣,生活有多艱辛,崇尚修齊治平的抱負和理想不能丟 。有過相同的經歷,一些感悟不得不共鳴:一是,真心希望天下有學,不因客觀原因而夭折了希望之星,未來人才 。二是,正向激勵莘莘學子,珍惜來之不易的學習環境,努力成為國之棟梁 。三是,推動社會援學助學,社會應更多地去關心愛護每一個孩子,讓其健康快樂成長 。四是,完善社會托底機制,別讓求學中的孩子們過多過早來承受不能承受之痛 。五是,常懷感恩勿需怨天,時代造就人才,時勢成就英雄 。走過風雨的人,更能堅定人生信念 。非科班出身,自學擼出中文分詞庫HanLP,在GitHub標星1.5萬,成為最受歡迎的自然語言處理項目 。他將學習經驗總結成書《自然語言處理入門》,幫助小白快速入門NLP 。針對題主的提問,HanLP自然語言處理類庫的開發者何晗的經驗很值得借鑒 。截至 2019 年 11月初,HanLP項目在 GitHub Star 數達到了 15.6 K,超過了賓夕法尼亞大學的 NLTK、斯坦福大學的 CoreNLP 。貼上GitHub地址:https://github.com/hankcs/HanLP何晗在開發這款 NLP 工具包時,還是上海外國語大學一名日語專業的大二學生,HanLP項目脫胎他大學時接的一份兼職,何晗也因緣從一個非科班專業的小白逐步成長為NLP領域的專家 。如今,正在攻讀CS博士的他(研究方向:句法分析、語義分析與問答系統),結合自己的學習歷程和HanLP的開發經驗創作出版了《自然語言處理入門》一書,得到了周明、劉群、王斌等業內頂級 NLP 專家的推薦 。從著手開發HanLP,到HanLP達到工業使用的水準,何晗對自學NLP有深刻的見解 。如果用一句話來總結,那就是:自頂而下,從工程去切入,由應用層往下面的基礎層拓展,遞歸補充理論知識,才能事半功倍 。以下入門NLP的建議,皆來自于何晗的經驗,分享給像題主這樣的初學者,希望能對大家有所啟發 。一、初學者,請避開自學NLP的常見誤區有的初學者排斥基礎理論——認為學校教的都是沒用的,公司里都用不到;有的初學者對基礎理論敬而遠之——認為理論太高深了,自己基礎不好,學了也白學;有的初學者,特別是已經工作的程序員,基本方向正確但學習路徑錯誤,比較容易走極端:在工作很忙的情況下,只是抱著經典書籍苦啃,直到筋疲力盡項目也毫無進展,從而喪失了學習NLP的興趣;或者,俗稱調庫小能手,跟風潮流,缺少理論基礎,缺乏獨立思考能力(比如,認為深度學習最牛,其他的基礎理論都是垃圾;認為CNN/RNN/BERT會調參就行了) 。而實際上,自然語言處理是計算機科學、人工智能和語言學學科的交集,這三方面的學科知識都是需要儲備的,基礎理論的學習必不可少 。但很多初學者都是在工作之后才入坑NLP,既難以靜下心來啃書啃課,又缺少很好的老師傳授知識經驗 。所以,有效可行的入門方式就是從工程切入,遵循這樣的邏輯:延遲加載,只在使用的時候才去加載必要的資料:你首先看到的是一個摸得著的實際問題,為了解決該問題才去接觸一個具體的方案;為了理解這個方案,才會引入必要的背景知識;為了實現這個方案,才會引入相關細節;為了克服這個方案的問題,才會過渡到新的方案 。二、想快速入門NLP,邊學邊做療效好何晗入門NLP,讀過的經典書有:《統計自然語言處理》(宗成慶 著)(對應語言學知識)、《統計學習方法》(李航 著)(對應人工智能知識),《挑戰程序設計競賽》(秋葉拓哉、鹽田陽一、北川宜稔 著)(對應計算機算法知識) 。不過,在看經典書籍的過程中,他發現,學習自然語言處理并不需要完全把這幾本書看透,最好是可以邊看書邊做項目 。這些書都是非常牛的好書,然而可惜的是,看完書中的章節,不知該如何應用其中的知識點,即使實現了文章中提到的模型,也很難直接將其運用于工程項目 。想必很多初學者都面臨類似的學習困惑 。為了解決這個問題,何晗動手寫了《自然語言處理入門》,目的就是希望學習者看完一章后,便可以將知識點直接用于項目,適合NLP初學者入門并快速布置到生產環境中 。成效快,痛苦小,疑問少 。何晗在《自然語言處理入門》一書中,以自己的HanLP開源項目為案例,代碼對照公式講解每一個算法每一個模型,讓入門者帶著工程思維理解NLP的知識要點,試圖在目前市面上艱深晦澀的教科書和簡單的入門書之間作出平衡 ?!蹲匀徽Z言處理入門》帶領學習者從基本概念入手 。逐步介紹中文分詞、詞性標注、命名實體識別、信息抽取、文本聚類、文本分類、句法分析這幾個熱門問題的算法原理和工程實現 。通過對多種算法的講解和實現,比較各自的優缺點和適用場景 。這些實現并非教學專用,而是生產級別的成熟代碼,可以直接用于實際項目 。在理解這些熱門問題的算法后,這本書會引導學習者根據自己的項目需求拓展新功能,最終達到理論和實踐上的同步入門 。何晗認為,NLP的學習路徑,應該尊重一般人的認知規律,而不是學術上的綱目順序,以此為宗旨來編排圖書的內容 。因此,面向普通程序員,這本書內容分為以下三大部分:第一部分介紹一些字符串算法,讓普通程序員從算法的角度思考中文信息處理 。第二部分由易到難地講解一些常用的機器學習模型,讓算法工程師晉級為機器學習工程師 。由中文分詞貫穿始終,構成一種探索式的遞進學習 。這些模型也并非局限于中文分詞,會在第三部分應用到更多的自然語言處理問題上去 。第三部分新增了許多與文本處理緊密相關的算法,讓機器學習工程師進化到自然語言處理工程師 。特別地,最后一章介紹了當前流行的深度學習方法,起到擴展視野、承上啟下的作用 。學習者可根據自身情況,靈活跳過部分章節 。何晗在自學過程中走過不少彎路,深知數學語言的艱深晦澀,并且痛恨羅列公式故作高深的文章,所以他在書中只保留了必不可少的公式和推導,并且公式與代碼相互印證 。配套代碼由Java和Python雙語言寫成,與GitHub上最新代碼同步更新,所以你只要具備基本的編程經驗,就可以跟隨書本零起點入門 。此外,何晗還總結出一份最為詳盡的NLP+ML“雙生樹”思維導圖,導圖中的關聯知識點不僅涵蓋NLP領域的核心知識,甚至涉及許多前沿研究和應用,印刷尺寸寬60cm,高74cm,隨書附贈供學習者參考 。三、進階NLP的學習資料和工具推薦推薦讀這些經典書籍:多讀論文,推薦用Google Scholar和Papers檢索:克服語言障礙,推薦用歐路詞典:追蹤前沿動態,推薦NLP-progress,在各項NLP任務上的排行榜網址:https://nlpprogress.com/一個中肯的建議:NLP沒有通用的解法,算法不夠,語料來補算法不是萬能的 。(想想:一兩個百分點對實際業務有多少幫助,又增加了多少成本?)不要完全相信論文 。(a. 不要相信不公開源代碼的論文; b. 不要相信公開源代碼但數據預處理作假的論文; c. 即使能跑出作者宣稱的分數,請考慮:模型是否能泛化到你的行業領域? 又增加了多少成本?)語料極其重要 。(a. 語料幾乎可以把準確率提升到你期望的任何水準,只要數量質量足夠; b. 目前通用語料幾乎都是新聞,誰能標注出行業語料,誰就是大王; c. 深度學習時代,無標注的純文本語料也大有用場;d. 軟件工程2.0:用數據編程 。)程序員向,對編程感興趣的可以了解一下一、數學基礎:1.Up主:3Blue1Brown的數學基礎:https://space.bilibili.com/88461692用動畫講述數學專業知識,其視頻涵蓋了線性代數、微積分、拓撲學等領域,每門課都配有直觀生動的動畫演示,幫助觀眾加深對數學概念定理的理解 。2.數學分析:https://www.bilibili.com/video/av8042121復旦陳紀修老師的數學分析視頻課程,共214講 。3.數學建模:www.bilibili.com/video/av8824879清華大學數學建模公開課,共84講 。4.統計學:https://www.bilibili.com/video/av7199273可汗學院公開課,統計學所有內容都涵蓋了 。共85講 。二、C與C++篇1.《帶你學C帶你飛》(小甲魚):https://www.bilibili.com/video/av277441412.《C++快速入門》(小甲魚):https://www.bilibili.com/video/av28127959三、Python 入門&&全棧:1、[小甲魚]零基礎入門學習Python:https://www.bilibili.com/video/av4050443視頻風格偏幽默,畫面雖然有點偏兒童風格,不像那種扁平化的風格高大上,但配合老師幽默的教學風格倒也顯得有點意思,不然播放量也不可能這么高 。2、Python編程 從入門到實踐:https://www.bilibili.com/video/av35698354每天30分鐘,特別適合毫無基礎都同學 。應該不會太無聊,而且時間適中 。不容易打擊積極性!目前共23節,還在持續更新中 。3.麻省理工公開課(計算機科學導論及Python編程):https://www.bilibili.com/video/av10497433英文字幕,名校課程 。建議英語水平過關的同學食用 。4.Python】這可能是你見過的最簡潔最沒有廢話的Python教程:https://www.bilibili.com/video/av5236569簡單直接,沒有廢話 。5.python全棧開發(入門到放棄):https://www.bilibili.com/video/av13690129內容豐富,包含 Python 領域方方面面,共 616 講 ??梢月目?。6.python數據結構與算法系列課程:https://www.bilibili.com/video/av21540971數據結構的Python語言實現課程,共44講 。四、數據分析:1.Python 數據分析與展示(北京理工大學 ):https://www.bilibili.com/video/av10101509北京理工大學MOOC課程,共65講 。2.Numpy & Pandas :https://www.bilibili.com/video/av16378934 莫煩 Python 數據處理教程,主要講解Numpy、Pandas兩個包的使用 。共18講 。五、爬蟲:1.Python網絡爬蟲與信息提?。篽ttps://www.bilibili.com/video/av9784617北京理工大學MOOC課程,共65講 。2.Python 爬蟲基礎教程 :https://www.bilibili.com/video/av17920849 莫煩出品,內容短小精悍,共13講 。六、可視化:1.Python數據可視化分析:https://www.bilibili.com/video/av6989413麥子學院的公開課,共31講 。2.Matplotlib Python 畫圖教程:https://www.bilibili.com/video/av16378354莫煩Python的課程內容,共19講 。七、機器學習篇:1.機器學習(Machine Learning)- 吳恩達(Andrew Ng):https://www.bilibili.com/video/av9912938機器學習四大天王稱號的吳恩達博士親自錄制的機器學習視頻課程,可以說是機器學習入門寶典 。2.李宏毅機器學習(2017):https://www.bilibili.com/video/av10590361大教授李宏毅制作的,經常被認為機器學習中文課程的首選,而且課程風格詼諧幽默,這就讓枯燥的課程變的有趣許多 。而且最重要的是,課程中布置了很多作業,而萬能的網友更是找出了作業答案,并將其公布在了留言區,可以說太良心了,簡直是沒錢報班學習者的福音 。3.機器學習算法-2017鄒博最新:https://www.bilibili.com/video/av235850804.NLP自然語言理解-中科院(宗成慶):https://www.bilibili.com/video/av233341205.【深度學習】深度學習NLP(牛津大學 2017):https://www.bilibili.com/video/av9817911英文版,英語水平極佳方可食用!6.斯坦福2017季CS224n深度學習自然語言處理課程:https://www.bilibili.com/video/av13383754英文版,英語水平極佳方可食用!7.Python+opencv3.3視頻教學:https://www.bilibili.com/video/av24998616基礎入門適合新手,OpenCV入門佳品,共30講 。我看了好幾遍《致謝》,甚為感動 。從農村、大山里走出來的寒門子弟,能勵志成才報效祖國,必將激勵一代又一代年輕人!古有顏回之樂 。“一簞食,一瓢飲,在陋巷 。人不堪其憂,回也不改其樂 。賢哉回也!”,后有王陽明的龍場悟道 ?!爸喒冽垐?,居夷處困,動心忍性之余,恍若有悟,體驗探求,再更寒暑,證諸五經、四子,沛然若決江河而放諸海也 。然后嘆圣人之道坦如大路 ?!边@些史學教育著我們,不管環境有多惡劣,生活有多艱辛,崇尚修齊治平的抱負和理想不能丟 。有過相同的經歷,一些感悟不得不共鳴:一是,真心希望天下有學,不因客觀原因而夭折了希望之星,未來人才 。二是,正向激勵莘莘學子,珍惜來之不易的學習環境,努力成為國之棟梁 。三是,推動社會援學助學,社會應更多地去關心愛護每一個孩子,讓其健康快樂成長 。四是,完善社會托底機制,別讓求學中的孩子們過多過早來承受不能承受之痛 。五是,常懷感恩勿需怨天,時代造就人才,時勢成就英雄 。走過風雨的人,更能堅定人生信念 。非科班出身,自學擼出中文分詞庫HanLP,在GitHub標星1.5萬,成為最受歡迎的自然語言處理項目 。他將學習經驗總結成書《自然語言處理入門》,幫助小白快速入門NLP 。針對題主的提問,HanLP自然語言處理類庫的開發者何晗的經驗很值得借鑒 。截至 2019 年 11月初,HanLP項目在 GitHub Star 數達到了 15.6 K,超過了賓夕法尼亞大學的 NLTK、斯坦福大學的 CoreNLP 。貼上GitHub地址:https://github.com/hankcs/HanLP何晗在開發這款 NLP 工具包時,還是上海外國語大學一名日語專業的大二學生,HanLP項目脫胎他大學時接的一份兼職,何晗也因緣從一個非科班專業的小白逐步成長為NLP領域的專家 。如今,正在攻讀CS博士的他(研究方向:句法分析、語義分析與問答系統),結合自己的學習歷程和HanLP的開發經驗創作出版了《自然語言處理入門》一書,得到了周明、劉群、王斌等業內頂級 NLP 專家的推薦 。從著手開發HanLP,到HanLP達到工業使用的水準,何晗對自學NLP有深刻的見解 。如果用一句話來總結,那就是:自頂而下,從工程去切入,由應用層往下面的基礎層拓展,遞歸補充理論知識,才能事半功倍 。以下入門NLP的建議,皆來自于何晗的經驗,分享給像題主這樣的初學者,希望能對大家有所啟發 。一、初學者,請避開自學NLP的常見誤區有的初學者排斥基礎理論——認為學校教的都是沒用的,公司里都用不到;有的初學者對基礎理論敬而遠之——認為理論太高深了,自己基礎不好,學了也白學;有的初學者,特別是已經工作的程序員,基本方向正確但學習路徑錯誤,比較容易走極端:在工作很忙的情況下,只是抱著經典書籍苦啃,直到筋疲力盡項目也毫無進展,從而喪失了學習NLP的興趣;或者,俗稱調庫小能手,跟風潮流,缺少理論基礎,缺乏獨立思考能力(比如,認為深度學習最牛,其他的基礎理論都是垃圾;認為CNN/RNN/BERT會調參就行了) 。而實際上,自然語言處理是計算機科學、人工智能和語言學學科的交集,這三方面的學科知識都是需要儲備的,基礎理論的學習必不可少 。但很多初學者都是在工作之后才入坑NLP,既難以靜下心來啃書啃課,又缺少很好的老師傳授知識經驗 。所以,有效可行的入門方式就是從工程切入,遵循這樣的邏輯:延遲加載,只在使用的時候才去加載必要的資料:你首先看到的是一個摸得著的實際問題,為了解決該問題才去接觸一個具體的方案;為了理解這個方案,才會引入必要的背景知識;為了實現這個方案,才會引入相關細節;為了克服這個方案的問題,才會過渡到新的方案 。二、想快速入門NLP,邊學邊做療效好何晗入門NLP,讀過的經典書有:《統計自然語言處理》(宗成慶 著)(對應語言學知識)、《統計學習方法》(李航 著)(對應人工智能知識),《挑戰程序設計競賽》(秋葉拓哉、鹽田陽一、北川宜稔 著)(對應計算機算法知識) 。不過,在看經典書籍的過程中,他發現,學習自然語言處理并不需要完全把這幾本書看透,最好是可以邊看書邊做項目 。這些書都是非常牛的好書,然而可惜的是,看完書中的章節,不知該如何應用其中的知識點,即使實現了文章中提到的模型,也很難直接將其運用于工程項目 。想必很多初學者都面臨類似的學習困惑 。為了解決這個問題,何晗動手寫了《自然語言處理入門》,目的就是希望學習者看完一章后,便可以將知識點直接用于項目,適合NLP初學者入門并快速布置到生產環境中 。成效快,痛苦小,疑問少 。何晗在《自然語言處理入門》一書中,以自己的HanLP開源項目為案例,代碼對照公式講解每一個算法每一個模型,讓入門者帶著工程思維理解NLP的知識要點,試圖在目前市面上艱深晦澀的教科書和簡單的入門書之間作出平衡 ?!蹲匀徽Z言處理入門》帶領學習者從基本概念入手 。逐步介紹中文分詞、詞性標注、命名實體識別、信息抽取、文本聚類、文本分類、句法分析這幾個熱門問題的算法原理和工程實現 。通過對多種算法的講解和實現,比較各自的優缺點和適用場景 。這些實現并非教學專用,而是生產級別的成熟代碼,可以直接用于實際項目 。在理解這些熱門問題的算法后,這本書會引導學習者根據自己的項目需求拓展新功能,最終達到理論和實踐上的同步入門 。何晗認為,NLP的學習路徑,應該尊重一般人的認知規律,而不是學術上的綱目順序,以此為宗旨來編排圖書的內容 。因此,面向普通程序員,這本書內容分為以下三大部分:第一部分介紹一些字符串算法,讓普通程序員從算法的角度思考中文信息處理 。第二部分由易到難地講解一些常用的機器學習模型,讓算法工程師晉級為機器學習工程師 。由中文分詞貫穿始終,構成一種探索式的遞進學習 。這些模型也并非局限于中文分詞,會在第三部分應用到更多的自然語言處理問題上去 。第三部分新增了許多與文本處理緊密相關的算法,讓機器學習工程師進化到自然語言處理工程師 。特別地,最后一章介紹了當前流行的深度學習方法,起到擴展視野、承上啟下的作用 。學習者可根據自身情況,靈活跳過部分章節 。何晗在自學過程中走過不少彎路,深知數學語言的艱深晦澀,并且痛恨羅列公式故作高深的文章,所以他在書中只保留了必不可少的公式和推導,并且公式與代碼相互印證 。配套代碼由Java和Python雙語言寫成,與GitHub上最新代碼同步更新,所以你只要具備基本的編程經驗,就可以跟隨書本零起點入門 。此外,何晗還總結出一份最為詳盡的NLP+ML“雙生樹”思維導圖,導圖中的關聯知識點不僅涵蓋NLP領域的核心知識,甚至涉及許多前沿研究和應用,印刷尺寸寬60cm,高74cm,隨書附贈供學習者參考 。三、進階NLP的學習資料和工具推薦推薦讀這些經典書籍:多讀論文,推薦用Google Scholar和Papers檢索:克服語言障礙,推薦用歐路詞典:追蹤前沿動態,推薦NLP-progress,在各項NLP任務上的排行榜網址:https://nlpprogress.com/一個中肯的建議:NLP沒有通用的解法,算法不夠,語料來補算法不是萬能的 。(想想:一兩個百分點對實際業務有多少幫助,又增加了多少成本?)不要完全相信論文 。(a. 不要相信不公開源代碼的論文; b. 不要相信公開源代碼但數據預處理作假的論文; c. 即使能跑出作者宣稱的分數,請考慮:模型是否能泛化到你的行業領域? 又增加了多少成本?)語料極其重要 。(a. 語料幾乎可以把準確率提升到你期望的任何水準,只要數量質量足夠; b. 目前通用語料幾乎都是新聞,誰能標注出行業語料,誰就是大王; c. 深度學習時代,無標注的純文本語料也大有用場;d. 軟件工程2.0:用數據編程 。)程序員向,對編程感興趣的可以了解一下一、數學基礎:1.Up主:3Blue1Brown的數學基礎:https://space.bilibili.com/88461692用動畫講述數學專業知識,其視頻涵蓋了線性代數、微積分、拓撲學等領域,每門課都配有直觀生動的動畫演示,幫助觀眾加深對數學概念定理的理解 。2.數學分析:https://www.bilibili.com/video/av8042121復旦陳紀修老師的數學分析視頻課程,共214講 。3.數學建模:www.bilibili.com/video/av8824879清華大學數學建模公開課,共84講 。4.統計學:https://www.bilibili.com/video/av7199273可汗學院公開課,統計學所有內容都涵蓋了 。共85講 。二、C與C++篇1.《帶你學C帶你飛》(小甲魚):https://www.bilibili.com/video/av277441412.《C++快速入門》(小甲魚):https://www.bilibili.com/video/av28127959三、Python 入門&&全棧:1、[小甲魚]零基礎入門學習Python:https://www.bilibili.com/video/av4050443視頻風格偏幽默,畫面雖然有點偏兒童風格,不像那種扁平化的風格高大上,但配合老師幽默的教學風格倒也顯得有點意思,不然播放量也不可能這么高 。2、Python編程 從入門到實踐:https://www.bilibili.com/video/av35698354每天30分鐘,特別適合毫無基礎都同學 。應該不會太無聊,而且時間適中 。不容易打擊積極性!目前共23節,還在持續更新中 。3.麻省理工公開課(計算機科學導論及Python編程):https://www.bilibili.com/video/av10497433英文字幕,名校課程 。建議英語水平過關的同學食用 。4.Python】這可能是你見過的最簡潔最沒有廢話的Python教程:https://www.bilibili.com/video/av5236569簡單直接,沒有廢話 。5.python全棧開發(入門到放棄):https://www.bilibili.com/video/av13690129內容豐富,包含 Python 領域方方面面,共 616 講 ??梢月目?。6.python數據結構與算法系列課程:https://www.bilibili.com/video/av21540971數據結構的Python語言實現課程,共44講 。四、數據分析:1.Python 數據分析與展示(北京理工大學 ):https://www.bilibili.com/video/av10101509北京理工大學MOOC課程,共65講 。2.Numpy & Pandas :https://www.bilibili.com/video/av16378934 莫煩 Python 數據處理教程,主要講解Numpy、Pandas兩個包的使用 。共18講 。五、爬蟲:1.Python網絡爬蟲與信息提取:https://www.bilibili.com/video/av9784617北京理工大學MOOC課程,共65講 。2.Python 爬蟲基礎教程 :https://www.bilibili.com/video/av17920849 莫煩出品,內容短小精悍,共13講 。六、可視化:1.Python數據可視化分析:https://www.bilibili.com/video/av6989413麥子學院的公開課,共31講 。2.Matplotlib Python 畫圖教程:https://www.bilibili.com/video/av16378354莫煩Python的課程內容,共19講 。七、機器學習篇:1.機器學習(Machine Learning)- 吳恩達(Andrew Ng):https://www.bilibili.com/video/av9912938機器學習四大天王稱號的吳恩達博士親自錄制的機器學習視頻課程,可以說是機器學習入門寶典 。2.李宏毅機器學習(2017):https://www.bilibili.com/video/av10590361大教授李宏毅制作的,經常被認為機器學習中文課程的首選,而且課程風格詼諧幽默,這就讓枯燥的課程變的有趣許多 。而且最重要的是,課程中布置了很多作業,而萬能的網友更是找出了作業答案,并將其公布在了留言區,可以說太良心了,簡直是沒錢報班學習者的福音 。3.機器學習算法-2017鄒博最新:https://www.bilibili.com/video/av235850804.NLP自然語言理解-中科院(宗成慶):https://www.bilibili.com/video/av233341205.【深度學習】深度學習NLP(牛津大學 2017):https://www.bilibili.com/video/av9817911英文版,英語水平極佳方可食用!6.斯坦福2017季CS224n深度學習自然語言處理課程:https://www.bilibili.com/video/av13383754英文版,英語水平極佳方可食用!7.Python+opencv3.3視頻教學:https://www.bilibili.com/video/av24998616基礎入門適合新手,OpenCV入門佳品,共30講 。非科班出身,自學擼出中文分詞庫HanLP,在GitHub標星1.5萬,成為最受歡迎的自然語言處理項目 。他將學習經驗總結成書《自然語言處理入門》,幫助小白快速入門NLP 。針對題主的提問,HanLP自然語言處理類庫的開發者何晗的經驗很值得借鑒 。截至 2019 年 11月初,HanLP項目在 GitHub Star 數達到了 15.6 K,超過了賓夕法尼亞大學的 NLTK、斯坦福大學的 CoreNLP 。貼上GitHub地址:https://github.com/hankcs/HanLP何晗在開發這款 NLP 工具包時,還是上海外國語大學一名日語專業的大二學生,HanLP項目脫胎他大學時接的一份兼職,何晗也因緣從一個非科班專業的小白逐步成長為NLP領域的專家 。如今,正在攻讀CS博士的他(研究方向:句法分析、語義分析與問答系統),結合自己的學習歷程和HanLP的開發經驗創作出版了《自然語言處理入門》一書,得到了周明、劉群、王斌等業內頂級 NLP 專家的推薦 。從著手開發HanLP,到HanLP達到工業使用的水準,何晗對自學NLP有深刻的見解 。如果用一句話來總結,那就是:自頂而下,從工程去切入,由應用層往下面的基礎層拓展,遞歸補充理論知識,才能事半功倍 。以下入門NLP的建議,皆來自于何晗的經驗,分享給像題主這樣的初學者,希望能對大家有所啟發 。一、初學者,請避開自學NLP的常見誤區有的初學者排斥基礎理論——認為學校教的都是沒用的,公司里都用不到;有的初學者對基礎理論敬而遠之——認為理論太高深了,自己基礎不好,學了也白學;有的初學者,特別是已經工作的程序員,基本方向正確但學習路徑錯誤,比較容易走極端:在工作很忙的情況下,只是抱著經典書籍苦啃,直到筋疲力盡項目也毫無進展,從而喪失了學習NLP的興趣;或者,俗稱調庫小能手,跟風潮流,缺少理論基礎,缺乏獨立思考能力(比如,認為深度學習最牛,其他的基礎理論都是垃圾;認為CNN/RNN/BERT會調參就行了) 。而實際上,自然語言處理是計算機科學、人工智能和語言學學科的交集,這三方面的學科知識都是需要儲備的,基礎理論的學習必不可少 。但很多初學者都是在工作之后才入坑NLP,既難以靜下心來啃書啃課,又缺少很好的老師傳授知識經驗 。所以,有效可行的入門方式就是從工程切入,遵循這樣的邏輯:延遲加載,只在使用的時候才去加載必要的資料:你首先看到的是一個摸得著的實際問題,為了解決該問題才去接觸一個具體的方案;為了理解這個方案,才會引入必要的背景知識;為了實現這個方案,才會引入相關細節;為了克服這個方案的問題,才會過渡到新的方案 。二、想快速入門NLP,邊學邊做療效好何晗入門NLP,讀過的經典書有:《統計自然語言處理》(宗成慶 著)(對應語言學知識)、《統計學習方法》(李航 著)(對應人工智能知識),《挑戰程序設計競賽》(秋葉拓哉、鹽田陽一、北川宜稔 著)(對應計算機算法知識) 。不過,在看經典書籍的過程中,他發現,學習自然語言處理并不需要完全把這幾本書看透,最好是可以邊看書邊做項目 。這些書都是非常牛的好書,然而可惜的是,看完書中的章節,不知該如何應用其中的知識點,即使實現了文章中提到的模型,也很難直接將其運用于工程項目 。想必很多初學者都面臨類似的學習困惑 。為了解決這個問題,何晗動手寫了《自然語言處理入門》,目的就是希望學習者看完一章后,便可以將知識點直接用于項目,適合NLP初學者入門并快速布置到生產環境中 。成效快,痛苦小,疑問少 。何晗在《自然語言處理入門》一書中,以自己的HanLP開源項目為案例,代碼對照公式講解每一個算法每一個模型,讓入門者帶著工程思維理解NLP的知識要點,試圖在目前市面上艱深晦澀的教科書和簡單的入門書之間作出平衡 ?!蹲匀徽Z言處理入門》帶領學習者從基本概念入手 。逐步介紹中文分詞、詞性標注、命名實體識別、信息抽取、文本聚類、文本分類、句法分析這幾個熱門問題的算法原理和工程實現 。通過對多種算法的講解和實現,比較各自的優缺點和適用場景 。這些實現并非教學專用,而是生產級別的成熟代碼,可以直接用于實際項目 。在理解這些熱門問題的算法后,這本書會引導學習者根據自己的項目需求拓展新功能,最終達到理論和實踐上的同步入門 。何晗認為,NLP的學習路徑,應該尊重一般人的認知規律,而不是學術上的綱目順序,以此為宗旨來編排圖書的內容 。因此,面向普通程序員,這本書內容分為以下三大部分:第一部分介紹一些字符串算法,讓普通程序員從算法的角度思考中文信息處理 。第二部分由易到難地講解一些常用的機器學習模型,讓算法工程師晉級為機器學習工程師 。由中文分詞貫穿始終,構成一種探索式的遞進學習 。這些模型也并非局限于中文分詞,會在第三部分應用到更多的自然語言處理問題上去 。第三部分新增了許多與文本處理緊密相關的算法,讓機器學習工程師進化到自然語言處理工程師 。特別地,最后一章介紹了當前流行的深度學習方法,起到擴展視野、承上啟下的作用 。學習者可根據自身情況,靈活跳過部分章節 。何晗在自學過程中走過不少彎路,深知數學語言的艱深晦澀,并且痛恨羅列公式故作高深的文章,所以他在書中只保留了必不可少的公式和推導,并且公式與代碼相互印證 。配套代碼由Java和Python雙語言寫成,與GitHub上最新代碼同步更新,所以你只要具備基本的編程經驗,就可以跟隨書本零起點入門 。此外,何晗還總結出一份最為詳盡的NLP+ML“雙生樹”思維導圖,導圖中的關聯知識點不僅涵蓋NLP領域的核心知識,甚至涉及許多前沿研究和應用,印刷尺寸寬60cm,高74cm,隨書附贈供學習者參考 。三、進階NLP的學習資料和工具推薦推薦讀這些經典書籍:多讀論文,推薦用Google Scholar和Papers檢索:克服語言障礙,推薦用歐路詞典:追蹤前沿動態,推薦NLP-progress,在各項NLP任務上的排行榜網址:https://nlpprogress.com/一個中肯的建議:NLP沒有通用的解法,算法不夠,語料來補算法不是萬能的 。(想想:一兩個百分點對實際業務有多少幫助,又增加了多少成本?)不要完全相信論文 。(a. 不要相信不公開源代碼的論文; b. 不要相信公開源代碼但數據預處理作假的論文; c. 即使能跑出作者宣稱的分數,請考慮:模型是否能泛化到你的行業領域? 又增加了多少成本?)語料極其重要 。(a. 語料幾乎可以把準確率提升到你期望的任何水準,只要數量質量足夠; b. 目前通用語料幾乎都是新聞,誰能標注出行業語料,誰就是大王; c. 深度學習時代,無標注的純文本語料也大有用場;d. 軟件工程2.0:用數據編程 。)5,中國京劇中的第一個女老演員是誰 恩曉峰(1887-1949年),。這位清末敢于反抗封建禮教、駭世驚俗的叛逆小姐,紅遍京、津、滬,并灌有汪派戲唱片留世 。恩曉峰(1887-1949年),滿族正黃旗人,生于北京 。幼年時常隨其父出入清音票房聽唱 。15歲時即常以“小客串”名義于戲園演唱 。曾向陳彥衡、竇硯峰問藝,請吳聯奎練功,技藝與日俱增 。她臺風大雅技藝不凡,且多才多藝 。除本工老生外,亦能武生戲《駱馬湖》、凈角戲《盜御馬》及丑角戲《十八扯》等 。恩曉峰是京劇第一女老生演員,京劇真正第一位女性演員應該是雪艷琴,她與老生楊寶忠、武生周瑞安共組“成慶社”,一改男女不同臺,不同班的舊制,從此標新立異,開創男女演員合演班的第一家,1932年26歲與已享譽盛名的譚富英分飾鐵鏡公主、楊四郎,拍攝京劇史上第一部有聲、實景影片《四郎探母》 。新中國成立后,參加中國京劇院 。不僅主演傳統戲,且在首部現代戲《白毛女》中,成功地飾演黃母一角,影響廣泛 。1959年后,專職為中國戲曲學院教授 。高人6,宗成慶的人物簡介宗成慶博士于1999年和2001年兩次在日本國際電氣通信基礎技術研究所(ATR)做客座研究員,2004年在法國格勒諾布爾(Grenoble)信息與應用數學研究院(IMAG)機器翻譯研究組(GETA)做短期高訪 。近幾年來,他主要從事自然語言處理理論與方法、口語自動翻譯、人機對話技術等方面的研究,目前擔任亞洲自然語言處理聯合會(AFNLP)執行理事、清華大學講座教授、中國人工智能學會理事及自然語言處理專業委員會副主任、中國中文信息學會理事 及機器翻譯專業委員會副主任和若干國際、國內會議的程序委員會主席、程序委員會委員等多種學術職務 。作為項目負責人承擔國家自然科學基金項目、國家“863”項目、國家重大基礎研究項目(973)子課題和國際合作研究項目等10余項,近幾年來,在國內外重要學術刊物和會議上發表學術論文60余篇,申請國家發明專利多項 。7,機器學習算法怎么使用中文語料 這個事情很簡單首先得有詞匯特征 就是一組詞語的集合比如特征集可以是[這,個,事情,簡單,機器,學習,中文,語料]有了這個以后就可以表示句子了例如:“這個事情很簡單”[1, 1, 1, 1, 0, 0, 0, 0]"機器學習算法怎么使用中文語料"[0, 0, 0, 0, 1, 1, 1, 1]看出啥意思了吧,對于一個句子,特征詞出現的位置就標1,不出現就標0 。所以句子就成了向量,用歐氏距離、余弦夾角等等方法就可以計算兩個向量的相似度,那就對應句子的相似度了 。這里面特征詞選擇方法有很多,常見的有TF、DF、TF-IDF等等,也可以人為指定 。向量里面表的數值也有很多算法,0、1是比較適合情感傾向分析的標法 。PMI指的是點互信息PMI(a, b)=p(a,b)/(p(a)p(b))假設有一個句子集合,總量為N出現a次數為A,出現b次數為Ba和b同時出現在同一句話中的次數為C則有p(a)=A/N,p(b)=B/N,p(a,b)=C/N帶入到公式里就算出PMI了 。計算PMI時,A、B、C、N的統計方法有很多策略,根據實際情況定 。相關資料你可以看一下《統計自然語言處理》 宗成慶 寫的 。若想了解更牛逼的辦法的話 先把統計分析、實分析、泛函分析、變分分析、隨機過程、矩陣論、向量空間論、模糊數學、圖論、代數圖論、數學分析、統計機器學習、模式識別、神經網絡、貝葉斯網絡、自然語言處理、社會網絡這些都學好,就可以獨步江湖 稱霸機器學習領域了~~哈哈~~我是來看評論的8,中國傳統的門神畫像原形是唐代的哪兩位大將 毋庸置疑,秦叔寶和尉遲敬德秦瓊和尉遲恭尉遲恭秦瓊(就是秦叔寶)每逢除夕,張貼年畫,也是我國古來的民俗之一 。年畫來源于貼門神 。據東漢蔡邕所著《獨斷》記載,我國最早的年畫題材是門神,畫的是神話傳說中的人物神茶、郁壘 。還有的畫古勇士成慶的像于殿門,畫虎于門 。宗懔在《荊楚歲時記》中說:“正月一日暮途窮,繪二神帖戶左右,左神茶,右郁壘,俗謂之門神 ?!惫糯牡乩碇鳌渡胶=洝芬灿写笾孪嗤挠涊d 。到了唐代,又有了以秦叔寶即秦瓊、尉遲恭即敬德和鐘馗形象作為門神的年畫,大都畫在桃木板上,掛于門墻,用意是消災納神,鎮妖避禍 。明吳承恩在《西游記》里講述了這樣一個故事:有一次,唐太宗生了病,夜以繼日做夢聽見鬼叫,無法安寢 。第二天告訴群臣后,大將秦叔寶和尉遲恭就全副披掛,仗劍執锏,在宮門把守了一通宵 。這一夜,唐太宗睡得很好,沒有夢見鬼 。唐太宗為了以后睡覺都能安寧,但又不忍心叫兩位老將夜夜守在宮門侍立,就命畫師畫了秦叔寶和尉遲恭兩人的像,懸掛在宮門兩邊,久而久之,上行下效,兩人就成了門神 。到了宋代,隨著木板雕刻技術的發展,逐步演化成了木板年畫,并分為著色套色兩種,現存最早的木刻年畫是宋版的《隨朝窈窕呈傾國之芳容》,畫著王昭君、趙飛燕、班姬、綠珠,習稱《四美圖》 。明末清初,出現了三大民間木刻年畫,天津的楊柳青、蘇州的桃花塢和山東省東濰縣的年畫,均有三百多年的歷史,在我國版畫史上享有重要地位,曾先后傳入日本和英、德等國 。始于南宋的福建年畫,暢銷南洋,深受歡迎.傳統的年畫多為木刻水印,線條單純,色彩鮮明,畫面熱鬧,題材多以五谷豐登、春牛、嬰兒、風景、花鳥等為內容,后來,上海鄭曼陀把月歷和年畫合二而一,制成月歷牌年畫和掛歷年畫,至今風靡全國 。9,機器學習算法中調參是什么 是指類似于learning rate的參數,還是指theta?如果是后者用梯度下降法等就可以調參,如果是前者麻煩一點,需要判斷一下,也可以可變參數,如果該參數工作效果沒有再高過以前的精準度并且過10次(也可以是其它次數),那么就判斷該learning rate為最好的 。這個事情很簡單 首先得有詞匯特征 就是一組詞語的集合 比如特征集可以是 [這,個,事情,簡單,機器,學習,中文,語料] 有了這個以后就可以表示句子了 例如: “這個事情很簡單” [1, 1, 1, 1, 0, 0, 0, 0] "機器學習算法怎么使用中文語料" [0, 0, 0, 0, 1, 1, 1, 1] 看出啥意思了吧,對于一個句子,特征詞出現的位置就標1,不出現就標0 。所以句子就成了向量,用歐氏距離、余弦夾角等等方法就可以計算兩個向量的相似度,那就對應句子的相似度了 。這里面特征詞選擇方法有很多,常見的有tf、df、tf-idf等等,也可以人為指定 。向量里面表的數值也有很多算法,0、1是比較適合情感傾向分析的標法 。pmi指的是點互信息 pmi(a, b)=p(a,b)/(p(a)p(b)) 假設有一個句子集合,總量為n 出現a次數為a,出現b次數為b a和b同時出現在同一句話中的次數為c 則有p(a)=a/n,p(b)=b/n,p(a,b)=c/n 帶入到公式里就算出pmi了 。計算pmi時,a、b、c、n的統計方法有很多策略,根據實際情況定 。相關資料你可以看一下《統計自然語言處理》 宗成慶 寫的 。若想了解更牛逼的辦法的話 先把統計分析、實分析、泛函分析、變分分析、隨機過程、矩陣論、向量空間論、模糊數學、圖論、代數圖論、數學分析、統計機器學習、模式識別、神經網絡、貝葉斯網絡、自然語言處理、社會網絡這些都學好,就可以獨步江湖 稱霸機器學習領域了~~哈哈~~10,門神是哪兩位在道教神仙體系中,最早的門神是傳說中能捉鬼的神荼、郁壘 。另外,古代一個叫做成慶的勇士也曾經是門神,還被記載在史書中 。到了唐代,門神的位置便被秦瓊(字叔寶)和尉遲恭(字敬德)所取代,這兩位門神是歷史上赫赫有名的一代名將,也是流傳最廣、影響最大的武將門神 。門神,是道教和民間信仰中每個家庭中司門守衛之神,人們將其神像貼于門上,用以驅邪避鬼、衛家宅、保平安、助功利、降吉祥等,是中國民間深受人們歡迎的守護神 。按照傳統習俗,每到春節前夕,家家戶戶便忙碌起來貼對聯和門神,以祈福來年家庭和睦、事業亨達 。在歷史上,門神一直都是正氣和武力的象征,古人認為,相貌出奇的人往往具有神奇的稟性和不凡本領 。他們心地正直善良,捉鬼擒魔是他們的天性和責任,例如人們所仰慕的捉鬼天師鐘馗,即是此種形象 。因此,門神的形象也是怒目圓睜,相貌威猛,手里拿著各種兵器,仿佛隨時準備同敢于上門來的鬼魅戰斗一般 。在道教神仙體系中,最早的門神是傳說中能捉鬼的神荼、郁壘 。相傳在上古時,有神荼、郁壘倆兄弟,他們住在東海度朔山上,山上有一棵桃樹,樹蔭如蓋 。每天早上,他們便在這樹下檢閱百鬼,如果有惡鬼為害人間,便將其綁了喂老虎 。后來,人們便用兩塊桃木板畫上神荼、郁壘的畫像,掛在門的兩邊用來驅鬼避邪 。除了神荼、郁壘外,古代一個叫做成慶的勇士也曾經是門神,還被記載在史書中,在班固《漢書·廣川王傳》中記載:廣川王(去疾)的殿門上曾畫有古勇士成慶的畫像,短衣大褲長劍 。到了唐代,門神的位置便被秦瓊(字叔寶)和尉遲恭(字敬德)所取代,這兩位門神可是歷史上赫赫有名的一代名將,也是流傳最廣、影響最大的武將門神 。相傳,唐太宗生病,聽見門外鬼魅呼號,徹夜不得安寧 。于是他讓這兩位將軍手持武器立于門旁鎮守,第二天夜里就再也沒有鬼魅搔擾了 。其后,唐太宗讓人把這兩位將軍的形象畫下來貼在門上,果然夜里也同樣安寧,從此,這一習俗開始在民間廣為流傳 。按照傳統習俗,每到春節前夕,善信便會到宮觀恭請新年之門神,祈福來年,并在除夕上午擇吉時張貼于大門上(朝外一側),以保來年門戶清凈,家宅平安,護佑和守衛善信度過吉祥福瑞的一年 。如今,隨著社會的發展和意識形態的變化,盡管人們仍延續著“貼門神”的習俗,但與古時相比,其意義更進一步,除了貼門神的傳統含義外,更表達的是一種對平安、和諧社會的向往與追求 。11,中國年畫的兩個門神是誰 神仙本是人創造,在不同的時期、地哉也不一樣,最早記載的是漢時的“神茶(shentu)”、“郁壘(yulv)” 。到唐代,便產生了秦瓊、敬德 。有些地方也有關羽、關勝,岳飛、岳云等 。另外,門神總共分四類,以上是人們熟悉的武門神,貼在外門上,還有貼在內門上的文門神(文官形象)、兒童門畫、祥禽瑞獸等,講究太多 。叔寶 尉遲恭 傳說:昔為唐朝將;今作鎮宅神 。起源 門神源於遠古時期的庶物崇拜,殷代天子祭五祀,門既為其一,周代祭五祀於宮“門”—每日每時必經之處,自然加以重視,祭祀,對於門神以形像化及人格化 。漢有三位,一位是成慶,另二位是神茶及郁壘 。神茶 郁壘 神荼與郁壘則為專捉小鬼,降伏邪魔之鬼王 。他們專門擔任防衛家門、驅趕邪魔的任務 。唐有三位,二位是秦叔寶和尉遲恭,另一位是鐘馗 。唐朝門神的故事: 1.秦叔寶和尉遲恭 相傳俓河龍王因為差了行雨的時辰和下雨的雨量,而犯了天條,知悉將被 唐太宗的宰相魏徵所斬,於是向太宗求救 。太宗乃計請魏徵前來下棋,以耽誤監斬時辰,不料到了午時三刻,魏徵就在棋桌上睡著了,唐太宗以為如此龍王就可免於被斬,豈知魏徵就在夢中斬了俓河龍王的頭 。從此,龍王就天天來向太 宗索命,只要太宗想要就寢,門外就有鬼魅哭號,吵的太宗無法入睡 。次日太宗告訴群臣,秦叔寶建議:"愿與尉遲敬德戎裝立門外以伺 。於是太宗才能一夜好眠,而太宗也憐惜兩位將士的辛勞,命畫工將兩為將軍的畫像繪於宮門,以鎮壓鬼魅 。2.鐘馗則因生前宦場失意,無罪受屈,死后追封驅魔大神,民間將他供為后門神 。秦叔寶 尉遲恭 鐘馗 宋元之后,民間的門神更是變化,多得不可勝數 。其中較為流傳有秦叔寶和尉遲恭、溫礄、岳飛、趙云、孫矉、龐涓等古代忠臣名將為代表 。武將戰績顯赫,更能鎮鬼驅邪,無法越過門欄,家戶更加安全 。近年來,門神已由驅邪到招福,招財進寶,百子百孫,門神成為新年裝飾 。習俗: 秦叔寶與尉遲恭門神: 唐代名將秦叔寶與尉遲恭二位將軍 。粉面紅潤,鳳眼蒜鼻而唇厚順髯,腰佩寶劍與弓的是秦叔寶將軍 。面色如焦,濃眉瞪眼,且一臉腮胡,腰佩寶劍與箭的是尉遲恭將軍 。二人采雙足八卦步的立姿,雙手上下護胸,并執長柄鉞兵器 。老少太監門神: 門神為老少太監,分辨老少太監的方法主要是從面貌的不同來區分:年長的太監臉上刻畫出歲月的刻痕,年青的太監則面色圓潤 。在服飾方面,由上而下依序為圓「領衫」、「束玉帶」、「蟒袍」,而腳穿的是「笏頭履」 。所執的侍器,兩人亦有不同:年長的太監右手捧香爐,左手持拂塵;年輕的太監右手扶玉帶,左手捧著瓶花 。民間俗稱二人所捧之侍器為「香、花」 。宮娥門神: 兩位宮娥頭上均作束發,且打雙髻,髻下束有牡丹卷草花紋的「簪戴」,且耳下有垂珠的「耳墜」 。在服飾方面,身披「披帛」飄帶,給人有一種輕盈的感覺;身穿「直領襖」,上有菱形花紋;衣著大袍,腹有「圍腰」加「束」,「束」下懸有「宮條」和玉佩流蘇 。在所執侍器方面,左側的宮女左手捧桃果,右手執玉如意;右側的宮女右手捧高足的燈具,左手亦執玉如意 。二位宮娥和老少太監所捧的侍器加起來,正好是民間喜用的四祥器:香、花、燈、果 。哼哈二將門神: 左邊門的門神伸出一指,嘴巴微張,像是在大聲喝道:「哈」 。右門的門神則是翹起兩指,彷佛發出「哼」的一聲 。他們就是著名的守護神「哼哈二將」 。加官進祿門神: 門神一人持「冠」,一人捧「鹿」,「冠」與「官」諧音,「鹿」與「祿」諧音,組合起來便有了「加官進祿」的意思 。富貴進爵門神: 門神則一人捧「牡丹」,一人捧「爵」,「牡丹」比喻富貴,「爵」比喻「官爵」,結合起來,便有「富貴晉爵」的意思了 。字匾門神: 演變成只有字匾,通常窮人家用字匾門神 。尉遲恭和秦瓊尉遲恭和秦瓊 西游記上有

推薦閱讀