千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

掃一掃進入千鋒手機站

領(lǐng)取全套視頻

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置：首頁 > 技術(shù)干貨 > PythonDask（第2部分）

PythonDask（第2部分）

來源：千鋒教育

發(fā)布人：xqq

時間： 2023-07-21 17:03:10 1689930190

在上一個教程中，我們已經(jīng)理解了分布式計算的概念和 Dask 簡介。除了 Dask 接口的介紹，我們還了解了什么是 Dask 集群以及如何安裝 Dask。

桌面界面

正如我們已經(jīng)討論過的，Dask 接口有多種用于分布式計算的并行算法集。數(shù)據(jù)科學(xué)從業(yè)者很少使用基本的用戶界面來擴展 NumPy、Pandas 和 scikit-learn:

陣列:并行 NumPy

數(shù)據(jù)幀:平行 Pandas

機器學(xué)習(xí):并行 Scikit-Learn

我們已經(jīng)在前面的教程中介紹了 Dask Array 讓我們直接進入 Dask 數(shù)據(jù)幀。

搜索簡歷

【超參數(shù)調(diào)整】 被認為是建立模型的重要一步，可以極大地改變模型的實現(xiàn)。機器學(xué)習(xí)模型有各種各樣的超參數(shù)，很難理解哪個參數(shù)在特定情況下表現(xiàn)更好。手動執(zhí)行這項任務(wù)是相當(dāng)令人厭煩的工作。然而，Scikit-Learn 庫提供了網(wǎng)格搜索，以簡化超參數(shù)調(diào)整的任務(wù)。用戶必須提供參數(shù)， Gridsearch 將提供這些參數(shù)的最佳組合。

讓我們考慮一個例子，在這個例子中，我們需要選擇一種隨機森林技術(shù)來適應(yīng)數(shù)據(jù)集。該模型有三個重要的可調(diào)參數(shù)——第一參數(shù)、第二參數(shù)和第三參數(shù)。

現(xiàn)在，讓我們在下面設(shè)置這些參數(shù)的值:

第一個參數(shù)-自舉=真

第二參數(shù)-最大深度- [8，9]

第三參數(shù)-n _ 估計量:[50，100，200]

1。sklearn Gridsearch: 對于每一個參數(shù)組合，Scikit-learn Gridsearch 都會執(zhí)行任務(wù)，有時最終會多次迭代單個任務(wù)。下圖表明，這并不是最有效的方法:

2。Dask-Search CV: 與 sklearn 的grid Search CV不同，Dask 提供了一個名為 Dask-Search CV 的庫。為了減少重復(fù)，Dask-Search CV 合并了這些步驟。我們可以通過以下步驟安裝 Dask-search :

使用 conda 安裝 Dask-搜索 CV


conda install dask-searchcv -c conda-forge

使用 pip 安裝 Dask-搜索 CV


$ pip install dask-searchcv

下圖展示了 Dask-Search CV 的工作原理:

Spark 和 Dask 的區(qū)別

以下是 Spark 和 Dask 的一個關(guān)鍵區(qū)別:

tags: python教程

聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

10年以上業(yè)內(nèi)強師集結(jié)，手把手帶你蛻變精英

請您保持通訊暢通，專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通

免費領(lǐng)取

今日已有369人領(lǐng)取成功

劉同學(xué) 138****2860 剛剛成功領(lǐng)取

王同學(xué) 131****2015 剛剛成功領(lǐng)取

張同學(xué) 133****4652 剛剛成功領(lǐng)取

李同學(xué) 135****8607 剛剛成功領(lǐng)取

楊同學(xué) 132****5667 剛剛成功領(lǐng)取

岳同學(xué) 134****6652 剛剛成功領(lǐng)取

梁同學(xué) 157****2950 剛剛成功領(lǐng)取

劉同學(xué) 189****1015 剛剛成功領(lǐng)取

張同學(xué) 155****4678 剛剛成功領(lǐng)取

鄒同學(xué) 139****2907 剛剛成功領(lǐng)取

董同學(xué) 138****2867 剛剛成功領(lǐng)取

周同學(xué) 136****3602 剛剛成功領(lǐng)取

如何用Python創(chuàng)建虛擬環(huán)境

Python中的眾數(shù)

免費打包獲取

相關(guān)推薦HOT

為什么Hadoop是用Java實現(xiàn)的?

一、跨平臺能力多平臺運行：Java的“一次編寫，到處運行”理念，使得Hadoop能在各種操作系統(tǒng)和硬件上運行，不需要特定的調(diào)整。廣泛應(yīng)用：這一特...詳情>>

2023-10-15 16:51:37

ECU是什么?

1、ECU的基本定義與作用ECU，全稱為電子控制單元，是一種專門用于控制汽車各個系統(tǒng)的微處理器控制系統(tǒng)。通過接收傳感器的信號并轉(zhuǎn)換成控制指令...詳情>>

2023-10-15 16:29:54

什么是SOA?

1、SOA的基本概念與核心原則SOA是一種使軟件組件通過網(wǎng)絡(luò)進行互操作的架構(gòu)模式。核心原則包括：可發(fā)現(xiàn)的服務(wù)：服務(wù)應(yīng)容易發(fā)現(xiàn)和理解。松耦合：...詳情>>

2023-10-15 16:19:32

什么是內(nèi)存池?

1、內(nèi)存池的基本概念內(nèi)存池是一種內(nèi)存管理策略，旨在優(yōu)化內(nèi)存分配性能和減少碎片化。通過將內(nèi)存分配到大小固定的池中，應(yīng)用程序可以快速、高效...詳情>>

2023-10-15 16:16:15

ci構(gòu)建與編譯的區(qū)別是什么?

一、功能與目的構(gòu)建（Build）：構(gòu)建是將源代碼轉(zhuǎn)化為可執(zhí)行代碼的過程，它包括編譯、鏈接、打包等一系列步驟。構(gòu)建不僅僅局限于編譯，還可能涉...詳情>>

2023-10-15 15:57:11

久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

PythonDask（第2部分）