如何入門機(jī)器學(xué)習(xí)研究
機(jī)器學(xué)習(xí)(Machine Learning, ML)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。作為越來越受到矚目的學(xué)科,本篇簡要介紹如何做相關(guān)研究的入門。
首先找一本機(jī)器學(xué)習(xí)相關(guān)書籍,簡要過一遍基礎(chǔ)概念。
如果對于遇到的數(shù)學(xué)概念不明白的,還需要補(bǔ)充高數(shù)、線性代數(shù)、概率論相關(guān)知識。
熟悉了基礎(chǔ)概念之后,就可以到國際上的會議、期刊上尋找感興趣的方向的論文了。
了解一個(gè)領(lǐng)域的最新研究,需要泛讀大量文獻(xiàn)。選擇精讀其中有借鑒意義的部分文章,然后找到作者主頁(國際會議的文章作者一般都有個(gè)人主頁),可以獲取到代碼,論文中往往也會提到數(shù)據(jù)集。獲取到代碼和數(shù)據(jù)集之后,就可以著手復(fù)現(xiàn)論文中的實(shí)驗(yàn)了。
在復(fù)現(xiàn)實(shí)驗(yàn)之中,你會加深了解到論文的優(yōu)點(diǎn)和不足之處,也為以后自己的優(yōu)化奠定了基礎(chǔ)。
使用 Python 開始你的機(jī)器學(xué)習(xí)之旅
安裝 Anaconda
下一步是安裝 Anacona。有了 Anaconda ,你將可以開始使用 Python 來探索機(jī)器學(xué)習(xí)的世界了。Anaconda 的默認(rèn)安裝庫包含了進(jìn)行機(jī)器學(xué)習(xí)所需要的工具
基本的機(jī)器學(xué)習(xí)技能
有了一些基本的 Python 編程技能,你就可以開始學(xué)習(xí)一些基本的機(jī)器學(xué)習(xí)技能了。一個(gè)實(shí)用的學(xué)習(xí)方法是學(xué)到一定技能便開始進(jìn)行練習(xí)。然而,如果你想深入學(xué)習(xí)這個(gè)領(lǐng)域,那么你需要準(zhǔn)備投入更多的學(xué)習(xí)時(shí)間。
一個(gè)獲取技能的有效方法是在線課程。吳恩達(dá)的 Coursera 機(jī)器學(xué)習(xí)課程 是一個(gè)不錯(cuò)的選擇。其它有用的在線訓(xùn)練包括:
Python 機(jī)器學(xué)習(xí): Scikit-Learn 教程
Python 實(shí)用機(jī)器學(xué)習(xí)教程
你也可以在 LiveEdu.tv 上觀看機(jī)器學(xué)習(xí)視頻,從而進(jìn)一步了解這個(gè)領(lǐng)
學(xué)習(xí)更多的 Python 庫
當(dāng)你對 Python 和機(jī)器學(xué)習(xí)有一個(gè)好的感覺之后,可以開始學(xué)習(xí)一些開源的 Python 庫??茖W(xué)的 Python 庫將會使完成一些簡單的機(jī)器學(xué)習(xí)任務(wù)變得很簡單。然而,選擇什么庫是完全主觀的,并且在業(yè)界內(nèi)許多人有很大的爭論。
一些實(shí)用的 Python 庫包括:
Scikit-learn :一個(gè)優(yōu)雅的機(jī)器學(xué)習(xí)算法庫,可用于數(shù)據(jù)挖掘和數(shù)據(jù)分析任務(wù)。
Tensorflow :一個(gè)易于使用的神經(jīng)網(wǎng)絡(luò)庫。
Theano : 一個(gè)強(qiáng)大的機(jī)器學(xué)習(xí)庫,可以幫助你輕松的評估數(shù)學(xué)表達(dá)式。
Pattern : 可以幫助你進(jìn)行自然語言處理、數(shù)據(jù)挖掘以及更多的工作。
Nilearn :基于 Scikit-learn,它可以幫助你進(jìn)行簡單快速的統(tǒng)計(jì)學(xué)習(xí)。
探索機(jī)器學(xué)習(xí)
對基本的 Python、機(jī)器學(xué)習(xí)技能和 Python 庫有了一定理解之后,就可以開始探索機(jī)器學(xué)習(xí)了。接下來,嘗試探索一下 Scikit-learn 庫。一個(gè)不錯(cuò)的教程是 Jake VanderPlas 寫的 Scikit-learn 簡介。
然后,進(jìn)入中級主題,比如 K-均值聚類算法簡介、線性回歸、決策樹和邏輯回歸。
最后,深入高級機(jī)器學(xué)習(xí)主題,比如向量機(jī)和復(fù)雜數(shù)據(jù)轉(zhuǎn)換。
就像學(xué)習(xí)任何新技能一樣,練習(xí)得越多,就會學(xué)得越好。你可以通過練習(xí)不同的算法,使用不同的數(shù)據(jù)集來更好的理解機(jī)器學(xué)習(xí),并提高解決問題的整體能力。
使用 Python 進(jìn)行機(jī)器學(xué)習(xí)是對你的技能的一個(gè)很好的補(bǔ)充,并且有大量免費(fèi)和低成本的在線資源可以幫助你。
途傲科技為中小企業(yè)提供網(wǎng)站制作、網(wǎng)站建設(shè)、微信H5、微信小程序,多商戶平臺,多級分銷系統(tǒng),APP開發(fā),手機(jī)網(wǎng)站,HTML5多端自適應(yīng)網(wǎng)站,營銷型企業(yè)站建設(shè),及對技術(shù)人才的培養(yǎng)等都積累與沉淀了豐富的心得和實(shí)戰(zhàn)經(jīng)驗(yàn)。
如果您有想法,可以將需求提交給我們【免費(fèi)提交需求,獲取解決方案】
免責(zé)聲明:文章部分內(nèi)容收集于互聯(lián)網(wǎng),不代表本站的觀點(diǎn)和立場,如有侵權(quán)請聯(lián)系刪除。