Python数据科学(數據科學) [Python-Data-Science-Handbook]

Python数据科学(數據科學) [Python-Data-Science-Handbook]

Python数据科学(數據科學) [Python-Data-Science-Handbook]


資料來源: 

https://github.com/wangyingsm/Python-Data-Science-Handbook/tree/master/notebooks
https://github.com/jakevdp/PythonDataScienceHandbook/tree/master/notebooks


GITHUB: https://github.com/jash-git/Python-Data-Science-Handbook


序言

1. IPython:超越Python解譯器
    IPython幫助和⽂檔
    IPython Shell中的鍵盤快速鍵
    IPython魔術命令
    輸⼊輸出歷史
    IPython和Shell命令
    錯誤和調試
    性能測算和計時
    更多IPython資源
2. Numpy介紹
    理解Python中的資料類型
    Numpy陣列基礎
    使⽤Numpy計算:通⽤函數
    聚合:Min, Max, 以及其他
    在陣列上計算:⼴播
    比較,遮蓋和布林邏輯
    高級索引
    陣列排序
    格式化資料:NumPy⾥的結構化陣列
3. 使用Pandas進⾏資料處理
    Pandas對象簡介
    資料索引和選擇
    在Pandas中運算元據
    處理空缺資料
    層次化的索引
    組合資料集:Concat 和 Append
    組合資料集:Merge 和 Join
    聚合與分組
    樞紐分析表
    向量化的字串操作
    在時間序列上操作
    高性能Pandas: eval() 和 query()
    更多資源
4. 使⽤matplotlib展⽰數據
    簡單的折線圖
    簡單的散點圖
    誤差視覺化
    密度和輪廓圖
    直方圖, 分桶和密度
    自定義圖表圖例
    自定義顏色條
    多個子圖表
    文本和標注
    自定義刻度
    自定義matplotlib:配置和樣式單
    在matplotlib中創建三維圖表
    使用Basemap創建地理位置圖表
    使用Seaborn進⾏視覺化
    更多資源
5. 機器學習
    什麼是機器學習?
    Scikit-Learn簡介
    超參數及模型驗證
    特徵⼯程
    深入:樸素⻉葉斯分類
    深入:線性回歸
    深入:⽀持向量機
    深入:決策樹和隨機森林
    深入:主成分分析
    深入:流形學習
    深入:k-均值聚類
    深入:⾼斯混合模型
    深入:核密度估計
    應用:臉部識別管道
更多機器學習資源
附錄:生成圖像的代碼

Table of Contents
Preface
1. IPython: Beyond Normal Python
    Help and Documentation in IPython
    Keyboard Shortcuts in the IPython Shell
    IPython Magic Commands
    Input and Output History
    IPython and Shell Commands
    Errors and Debugging
    Profiling and Timing Code
    More IPython Resources
2. Introduction to NumPy
    Understanding Data Types in Python
    The Basics of NumPy Arrays
    Computation on NumPy Arrays: Universal Functions
    Aggregations: Min, Max, and Everything In Between
    Computation on Arrays: Broadcasting
    Comparisons, Masks, and Boolean Logic
    Fancy Indexing
    Sorting Arrays
    Structured Data: NumPy’s Structured Arrays
3. Data Manipulation with Pandas
    Introducing Pandas Objects
    Data Indexing and Selection
    Operating on Data in Pandas
    Handling Missing Data
    Hierarchical Indexing
    Combining Datasets: Concat and Append
    Combining Datasets: Merge and Join
    Aggregation and Grouping
    Pivot Tables
    Vectorized String Operations
    Working with Time Series
    High-Performance Pandas: eval() and query()
Further Resources
4. Visualization with Matplotlib
    Simple Line Plots
    Simple Scatter Plots
    Visualizing Errors
    Density and Contour Plots
    Histograms, Binnings, and Density
    Customizing Plot Legends
    Customizing Colorbars
    Multiple Subplots
    Text and Annotation
    Customizing Ticks
    Customizing Matplotlib: Configurations and Stylesheets
    Three-Dimensional Plotting in Matplotlib
    Geographic Data with Basemap
    Visualization with Seaborn
    Further Resources
5. Machine Learning
    What Is Machine Learning?
    Introducing Scikit-Learn
    Hyperparameters and Model Validation
    Feature Engineering
    In Depth: Naive Bayes Classification
    In Depth: Linear Regression
    In-Depth: Support Vector Machines
    In-Depth: Decision Trees and Random Forests
    In Depth: Principal Component Analysis
    In-Depth: Manifold Learning
    In Depth: k-Means Clustering
    In Depth: Gaussian Mixture Models
    In-Depth: Kernel Density Estimation
    Application: A Face Detection Pipeline
    Further Machine Learning Resources
    Appendix: Figure Code

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *