Python機器學習基礎教程PDF版電子書免費下載

資料大小: 16.85 MB

所需積分: 0

下載次數:

用户評論: 0條評論,查看

上傳日期: 2019-03-04

上 傳 者: 醜書哇哈哈他上傳的所有資料

資料介紹

標籤:python(834)機器學習(2200)人工智能(12915)

  本書是機器學習入門書,以 Python 語言介紹。主要內容包括 :機器學習的基本概念及其應用 ;實踐中最常用的機器學習算法以及這些算法的優缺點 ;在機器學習中待處理數據的呈現方式的重要性,以及應重點關注數據的哪些方面 ;模型評估和調參的高級方法,重點講解交叉驗證和網格搜索 ;管道的概念 ;如何將前面各章的方法應用到文本數據上,還介紹了一些文本特有的處理方法。

  本書適合機器學習從業者或有志成為機器學習從業者的人閲讀。

  目前,從醫療診斷和治療到在社交網絡上尋找好友,許多商業應用和研究項目都離不開機器學習。許多人以為,只有大公司的大型研究團隊才能用到機器學習。在本書中,我們要向你展示,自己動手構建機器學習解決方案是多麼容易的一件事,也將介紹如何將這件事做到最好。學完本書中的知識,你可以自己構建系統,研究 Twitter 用户的情感,或者對全球變暖做出預測。機器學習的應用十分廣泛,如今的海量數據使得其應用範圍更是遠超人們的想象。

  本書是為機器學習從業者或有志成為機器學習從業者的人準備的,他們在為現實生活中的機器學習問題尋找解決方案。這是一本入門書,不需要讀者具備機器學習或人工智能(artificial intelligence,AI)的相關知識。我們主要使用 Python 和 scikit-learn 庫,一步一步構建一個有效的機器學習應用。我們介紹的方法適用於科學家和研究人員,也會對開發商業應用的數據科學家有所幫助。如果你對 Python 以及 NumPy 和 matplotlib 庫有所瞭解的話,將能夠更好地掌握本書的內容。

  我們刻意不將數學作為重點,而是將機器學習算法的實踐作為重點。數學(尤其是概率論)是機器學習算法的基石,所以我們不會詳細分析算法的細節。如果你對機器學習算法的數學部分感興趣,我們推薦閲讀 Trevor HasTIe、Robert TIbshirani 和 Jerome Friedman 合著的《統計學習基礎》(Elements of StaTIsTIcal Learning,Springer 出版社)一書,可以在幾位作者的網站上免費閲讀這本書(//statweb.stanford.edu/~tibs/ElemStatLearn/)。我們也不會從頭講解如何編寫機器學習算法,而是將重點放在如何應用 scikit-learn 庫和其他庫中已經實現的海量模型。

  本書的結構大致如下。

  • 第 1 章介紹機器學習的基本概念及其應用,並給出本書會用到的基本設置。

  • 第 2 章和第 3 章介紹實踐中最常用的機器學習算法,並討論這些算法的優缺點。

  • 第 4 章介紹在機器學習中待處理數據的呈現方式的重要性,以及應重點關注數據的哪些方面。

  • 第 5 章介紹模型評估和調參的高級方法,重點講解交叉驗證和網格搜索。

  • 第 6 章解釋管道的概念。管道用於串聯多個模型並封裝工作流。

  • 第 7 章介紹如何將前面各章講述的方法應用到文本數據上,還介紹了一些文本特有的處理方法。

  • 第 8 章對全書進行總結,還介紹了有關更高級主題的參考資料。

  雖然第 2 章和第 3 章給出了實際算法,但對於初學者來説,並不需要理解所有這些算法。如果你想要儘快構建一個機器學習系統,我們建議你首先閲讀第 1 章和第 2 章的開始部分,裏面介紹了所有的核心概念。然後你可以翻到 2.5 節,裏面提到了我們介紹的所有監督學習模型。從中選擇最適合你需求的模型,然後翻回到對應小節閲讀其詳細內容。之後你可以使用第 5 章中的方法對你的模型進行評估和調參。

  機器學習(machine learning)是從數據中提取知識。它是統計學、人工智能和計算機科學交叉的研究領域,也被稱為預測分析(predictive analytics)或統計學習(statistical learning)。近年來,機器學習方法已經應用到日常生活的方方面面。從自動推薦看什麼電影、點什麼食物、買什麼商品,到個性化的在線電台和從照片中識別好友,許多現代化網站和設備的核心都是機器學習算法。當你訪問像 Facebook、Amazon 或 Netflix 這樣的複雜網站時,很可能網站的每一部分都包含多種機器學習模型

  除了商業應用之外,機器學習也對當前數據驅動的研究方法產生了很大影響。本書中介紹的工具均已應用在各種科學問題上,比如研究恆星、尋找遙遠的行星、發現新粒子、分析 DNA 序列,以及提供個性化的癌症治療方案。

  不過,如果想受益於機器學習算法,你的應用無需像上面那些例子那樣給世界帶來重大改變,數據量也用不着那麼大。本章將解釋機器學習如此流行的原因,並探討機器學習可以解決哪些類型的問題。然後將向你展示如何構建第一個機器學習模型,同時介紹一些重要的概念。

用户評論

查看全部 條評論

發表評論請先 , 還沒有賬號?免費註冊

發表評論

用户評論
技術交流、我要發言! 發表評論可獲取積分! 請遵守相關規定。
上傳電子資料