1. <ul id="0c1fb"></ul>

      <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
      <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区

      RELATEED CONSULTING
      相關(guān)咨詢
      選擇下列產(chǎn)品馬上在線溝通
      服務(wù)時間:8:30-17:00
      你可能遇到了下面的問題
      關(guān)閉右側(cè)工具欄

      新聞中心

      這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      本篇內(nèi)容主要講解“怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究”吧!

      德城ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為成都創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18980820575(備注:SSL證書合作)期待與您的合作!

      1. 為何選擇Python?

      Python作為一種語言,十項全能,易于學(xué)習(xí),安裝簡單。同時有很多擴(kuò)展,非常適合進(jìn)行數(shù)據(jù)科學(xué)研究。像Google、Instagram、Youtube、Reddit等明星網(wǎng)站都在用Python搭建核心業(yè)務(wù)。

      Python不僅僅用于數(shù)據(jù)科學(xué),還使用Python來做更多的工作——如編寫腳本、構(gòu)建API、構(gòu)建網(wǎng)站等等。

      關(guān)于Python的幾點重要事項需要注意。

      • 目前,有兩種常用的Python版本。它們是版本2和3。大多數(shù)教程和本文將默認(rèn)使用的是Python的***版本Python  3。但有時會遇到使用Python  2的書籍或文章。版本之間的差異并不大,但有時在運(yùn)行版本3時復(fù)制和粘貼版本2代碼將無法正常工作,因此需要進(jìn)行一些輕微的編輯。

      • 要注意Python十分介意空白的地方(即空格和返回字符)。如果把空格放在錯誤的地方,程序很可能會產(chǎn)生錯誤。

      • 與其他語言相比,Python不需要管理內(nèi)存,也有良好的社區(qū)支持。

      2. 安裝Python

      安裝用于數(shù)據(jù)科學(xué)的Python的***方法是使用Anaconda發(fā)行版。

      Anacoda有你使用Python進(jìn)行數(shù)據(jù)科學(xué)研究所需的資料,包括將在本文中介紹的許多軟件包。

      單擊Products - >  Distribution并向下滾動,可以看到適用于Mac,Windows和Linux的安裝程序。即使Mac上已經(jīng)有Python,也應(yīng)該考慮安裝Anaconda發(fā)行版,因為有利于安裝其他軟件包。

      此外,還可以去官方Python網(wǎng)站下載安裝程序。

      包管理器:

      包是一段Python代碼,而不是語言的一部分,包對于執(zhí)行某些任務(wù)非常有幫助。通過包,我們可以復(fù)制并粘貼代碼,然后將其放在Python解釋器(用于運(yùn)行代碼)可以找到的地方。

      但這很麻煩,每次啟動新項目或更新包時都必須進(jìn)行內(nèi)容的復(fù)制和粘貼操作。因此,我們可以使用包管理器。Anaconda發(fā)行版中自帶包管理器。如果沒有,建議安裝pip。

      無論選擇哪一個,都可以在終端(或命令提示符)上使用命令輕松安裝和更新軟件包。

      3. 使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      Python迎合許多不同開發(fā)人員的技術(shù)要求(Web開發(fā)人員,數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家),因此使用該語言具有很多不同的編程方法。

      Python是一種解釋型語言,不必將代碼編譯成可執(zhí)行文件,只需將包含代碼的文本文檔傳遞給解釋器即可。

      快速瀏覽一下與Python解釋器交互的不同方法吧。

      (1) 在終端

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      如果打開終端(或命令提示符)并鍵入單詞'Python',將啟動一個shell會話。可以在對話中輸入有效的Python命令,以實現(xiàn)相應(yīng)的程序操作。

      這可以是快速調(diào)試某些東西的好方法,但即使是一個小項目,在終端中調(diào)試也很困難。

      (2) 使用文本編輯器

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      如果你在文本文件中編寫一系列Python命令并使用.py擴(kuò)展名保存它,則可以使用終端導(dǎo)航到該文件,并通過輸入python  YOUR_FILE_NAME.py來運(yùn)行該程序。

      這與在終端中逐個輸入命令基本相同,只是更容易修復(fù)錯誤并更改程序的功能。

      (3) 在IDE中

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      IDE是一種專業(yè)級軟件,可以進(jìn)行軟件項目管理。

      IDE的一個好處是,使用調(diào)試功能可以告訴你在嘗試運(yùn)行程序之前出錯的位置。

      某些IDE附帶了項目模板(用于特定任務(wù)),你可以使用這些模板根據(jù)***實踐設(shè)置項目。

      (4) Jupyter Notebooks

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      這些方法都不是用python進(jìn)行數(shù)據(jù)科學(xué)的***方式,***是使用Jupyter Notebooks。

      Jupyter  Notebooks使你能夠一次運(yùn)行一“塊”代碼,這意味著你可以在決定下一步做什么之前看到輸出信息-這在數(shù)據(jù)科學(xué)項目中非常重要,我們經(jīng)常需要在獲取輸出之前查看圖表。

      如果你正在使用Anaconda,且已經(jīng)安裝了Jupyter lab。要啟動它,只需要在終端中輸入'jupyter lab'即可。

      如果正在使用pip,則必須使用命令'python pip install jupyter'安裝Jupyter lab。

      4. Python中的數(shù)字計算

      NumPy軟件包中包含許多有用的函數(shù),用于執(zhí)行數(shù)據(jù)科學(xué)工作所需的數(shù)學(xué)運(yùn)算。

      它作為Anaconda發(fā)行版的一部分安裝,并且使用pip安裝,就像安裝Jupyter Notbooks一樣簡單('pip install  numpy')。

      我們在數(shù)據(jù)科學(xué)中需要做的最常見的數(shù)學(xué)運(yùn)算是矩陣乘法,計算向量的點積,改變數(shù)組的數(shù)據(jù)類型以及創(chuàng)建數(shù)組!

      以下是如何將列表編入NumPy數(shù)組的方法:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      以下是如何在NumPy中進(jìn)行數(shù)組乘法和計算點積的方法:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      以下是如何在NumPy中進(jìn)行矩陣乘法:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      5. Python中的統(tǒng)計分析

      Scipy包中包含專門用于統(tǒng)計的模塊(包的代碼的子部分)。

      你可以使用'from scipy import  stats'命令將其導(dǎo)入(在程序中使其功能可用)到你的筆記本中。該軟件包包含計算數(shù)據(jù)統(tǒng)計測量、執(zhí)行統(tǒng)計測試、計算相關(guān)性、匯總數(shù)據(jù)和研究各種概率分布所需的一切。

      以下是使用Scipy快速訪問數(shù)組的匯總統(tǒng)計信息(最小值,***值,均值,方差,偏斜和峰度)的方法:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      6. Python中的數(shù)據(jù)操作

      數(shù)據(jù)科學(xué)家必須花費(fèi)大量的時間來清理和整理數(shù)據(jù)。幸運(yùn)的是,Pandas軟件包可以幫助我們用代碼而不是手工來完成這項工作。

      使用Pandas執(zhí)行的最常見任務(wù)是從CSV文件和數(shù)據(jù)庫中讀取數(shù)據(jù)。

      它還具有強(qiáng)大的語法,可以將不同的數(shù)據(jù)集組合在一起(數(shù)據(jù)集在Pandas中稱為DataFrame)并執(zhí)行數(shù)據(jù)操作。

      使用.head方法查看DataFrame的前幾行:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      使用方括號選擇一列:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      通過組合其他列來創(chuàng)建新列:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      7. 在Python中使用數(shù)據(jù)庫

      為了使用pandas read_sql方法,必須提前建立與數(shù)據(jù)庫的連接。

      連接數(shù)據(jù)庫最安全的方法是使用Python的SQLAlchemy包。

      SQL本身就是一種語言,并且連接到數(shù)據(jù)庫的方式取決于你正在使用的數(shù)據(jù)庫。

      8. Python中的數(shù)據(jù)工程

      有時我們傾向于在數(shù)據(jù)作為Pandas DataFrame形式到達(dá)我們的項目之前,對其進(jìn)行一些計算。

      如果你正在使用數(shù)據(jù)庫或從Web上抓取數(shù)據(jù)(并將其存儲在某處),那么移動數(shù)據(jù)并對其進(jìn)行轉(zhuǎn)換的過程稱為ETL(提取,轉(zhuǎn)換,加載)。

      你從一個地方提取數(shù)據(jù),對其進(jìn)行一些轉(zhuǎn)換(通過添加數(shù)據(jù)來總結(jié)數(shù)據(jù),查找均值,更改數(shù)據(jù)類型等),然后將其加載到可以訪問的位置。

      有一個非常酷的工具叫做Airflow,它非常善于幫助管理ETL工作流程。更好的是,它是用Python編寫的,由Airbnb開發(fā)。

      9. Python中的大數(shù)據(jù)工程

      有時ETL過程可能非常慢。如果你有數(shù)十億行數(shù)據(jù)(或者如果它們是一種奇怪的數(shù)據(jù)類型,如文本),可以使用許多不同的計算機(jī)分別進(jìn)行處理轉(zhuǎn)換,并在***一秒將所有數(shù)據(jù)整合到一起。

      這種架構(gòu)模式稱為MapReduce,它很受Hadoop的歡迎。

      如今,很多人使用Spark來做這種數(shù)據(jù)轉(zhuǎn)換/檢索工作,并且有一個Spark的Python接口叫做PySpark。

      MapReduce架構(gòu)和Spark都是非常復(fù)雜的工具,這里我不詳細(xì)介紹。只要知道它們的存在,如果你發(fā)現(xiàn)自己正在處理非常緩慢的ETL過程,PySpark可能會有所幫助。

      10. Python中的進(jìn)一步統(tǒng)計

      我們已經(jīng)知道可以使用Scipy的統(tǒng)計模塊運(yùn)行統(tǒng)計測試、計算描述性統(tǒng)計、p值以及偏斜和峰度等事情,但Python還能做些什么呢?

      你應(yīng)該知道的一個特殊包是Lifelines包。

      使用Lifelines包,你可以從稱為生存分析的統(tǒng)計子字段計算各種函數(shù)。

      生存分析有很多應(yīng)用。我們可以用它來預(yù)測客戶流失(當(dāng)客戶取消訂閱時)以及零售商店何時可能會被盜竊。

      這些與包的創(chuàng)造者想象它將被用于完全不同(生存分析傳統(tǒng)上是醫(yī)學(xué)統(tǒng)計工具)的領(lǐng)域。但這只是展示了構(gòu)建數(shù)據(jù)科學(xué)問題的不同方式!

      11. Python中的機(jī)器學(xué)習(xí)

      這是一個重要的主題,機(jī)器學(xué)習(xí)正在風(fēng)靡世界,是數(shù)據(jù)科學(xué)家工作的重要組成部分。

      簡而言之,機(jī)器學(xué)習(xí)是一組允許計算機(jī)將輸入數(shù)據(jù)映射到輸出數(shù)據(jù)的技術(shù)。有一些情況并非如此,但它們屬于少數(shù),以這種方式考慮ML通常很有幫助。

      Python有兩個非常好的機(jī)器學(xué)習(xí)包。

      (1) Scikit-Learn

      在使用Python進(jìn)行機(jī)器學(xué)習(xí)的時候都會花大部分時間用于使用Scikit-Learn包(有時縮寫為sklearn)。

      這個包實現(xiàn)了一大堆機(jī)器學(xué)習(xí)算法,并通過一致的語法公開它們。這使得數(shù)據(jù)科學(xué)家很容易充分利用每種算法。

      使用Scikit-Learn的一般框架是這樣的——將數(shù)據(jù)集拆分為訓(xùn)練和測試數(shù)據(jù)集:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      實例化并訓(xùn)練一個模型:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      使用metrics模塊測試模型的工作情況:

      怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究

      (2) XGBoost

      在Python中常用于機(jī)器學(xué)習(xí)的第二個包是XGBoost。

      Scikit-Learn實現(xiàn)了一系列算法,XGBoost只實現(xiàn)了一個梯度提升的決策樹。

      最近這個包(和算法)因其在Kaggle比賽(任何人都可以參加的在線數(shù)據(jù)科學(xué)比賽)上被使用而取得成功,變得非常受歡迎。

      訓(xùn)練模型的工作方式與Scikit-Learn算法的工作方式大致相同。

      12. Python中的深度學(xué)習(xí)

      Scikit-Learn中提供的機(jī)器學(xué)習(xí)算法幾乎可以滿足任何問題。話雖這么說,但有時你需要使用***進(jìn)的算法。

      由于使用它們的系統(tǒng)幾乎優(yōu)于其他所有類算法,因此深度神經(jīng)網(wǎng)絡(luò)的普及率急劇上升。

      但是很難說神經(jīng)網(wǎng)絡(luò)正在做什么以及它為什么這樣做。因此,它們在金融、醫(yī)學(xué)、法律和相關(guān)專業(yè)中的使用并未得到廣泛認(rèn)可。

      神經(jīng)網(wǎng)絡(luò)的兩大類是卷積神經(jīng)網(wǎng)絡(luò)(用于對圖像進(jìn)行分類并完成計算機(jī)視覺中的許多其他任務(wù))和循環(huán)神經(jīng)網(wǎng)絡(luò)(用于理解和生成文本)。

      探索神經(jīng)網(wǎng)工作時超出了本文的范圍的機(jī)理,如果你想做這類工作,只要知道你需要尋找的包是TensorFlow(Google  contibution!)還是Keras。

      Keras本質(zhì)上是TensorFlow的包裝器,使其更易于使用。

      13. Python中的數(shù)據(jù)科學(xué)API

      一旦訓(xùn)練了模型,就可以在其他軟件中訪問它的預(yù)測,方法是創(chuàng)建一個API。

      API允許模型從外部源一次一行地接收數(shù)據(jù)并返回預(yù)測。因為Python是一種通用的編程語言,也可用于創(chuàng)建Web服務(wù),所以很容易使用Python通過API為模型提供服務(wù)。

      如果需要構(gòu)建API,應(yīng)該查看pickle和Flask。Pickle允許訓(xùn)練有素的模型被保存在硬盤驅(qū)動器上,以便以后使用。而Flask是創(chuàng)建Web服務(wù)的最簡單方法。

      14. Python中的Web應(yīng)用程序

      ***,如果你想圍繞數(shù)據(jù)科學(xué)項目構(gòu)建功能齊全的Web應(yīng)用程序,則應(yīng)使用Django框架。

      Django在Web開發(fā)社區(qū)非常受歡迎,并且用于構(gòu)建Instagram和Pinterest的***個版本(以及許多其他版本)。

      到此,相信大家對“怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!


      文章名稱:怎么使用Python進(jìn)行數(shù)據(jù)科學(xué)研究
      網(wǎng)頁網(wǎng)址:http://www.ef60e0e.cn/article/pddgdc.html
      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区
      1. <ul id="0c1fb"></ul>

        <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
        <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

        东方市| 湘潭市| 探索| 栾城县| 泽库县| 桂林市| 融水| 龙州县| 阿尔山市| 安龙县| 乌海市| 石景山区| 铜鼓县| 浦城县| 简阳市| 芦山县| 酉阳| 通城县| 公主岭市| 麻江县| 藁城市| 浑源县| 锡林郭勒盟| 色达县| 兰州市| 土默特右旗| 宁国市| 盘锦市| 长岛县| 泸溪县| 陆丰市| 灌云县| 唐海县| 平度市| 新野县| 会理县| 齐齐哈尔市| 泰兴市| 平谷区| 山丹县| 左云县|