久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進入千鋒手機站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > PythonDask(第2部分)

PythonDask(第2部分)

來源:千鋒教育
發(fā)布人:xqq
時間: 2023-07-21 17:03:10 1689930190

在上一個教程中,我們已經(jīng)理解了分布式計算的概念和 Dask 簡介。除了 Dask 接口的介紹,我們還了解了什么是 Dask 集群以及如何安裝 Dask。

桌面界面

正如我們已經(jīng)討論過的,Dask 接口有多種用于分布式計算的并行算法集。數(shù)據(jù)科學(xué)從業(yè)者很少使用基本的用戶界面來擴展 NumPy、Pandas 和 scikit-learn:

    陣列:并行 NumPy

    數(shù)據(jù)幀:平行 Pandas

    機器學(xué)習(xí):并行 Scikit-Learn

我們已經(jīng)在前面的教程中介紹了 Dask Array 讓我們直接進入 Dask 數(shù)據(jù)幀。

搜索簡歷

【超參數(shù)調(diào)整】 被認為是建立模型的重要一步,可以極大地改變模型的實現(xiàn)。機器學(xué)習(xí)模型有各種各樣的超參數(shù),很難理解哪個參數(shù)在特定情況下表現(xiàn)更好。手動執(zhí)行這項任務(wù)是相當(dāng)令人厭煩的工作。然而,Scikit-Learn 庫提供了網(wǎng)格搜索,以簡化超參數(shù)調(diào)整的任務(wù)。用戶必須提供參數(shù), Gridsearch 將提供這些參數(shù)的最佳組合。

讓我們考慮一個例子,在這個例子中,我們需要選擇一種隨機森林技術(shù)來適應(yīng)數(shù)據(jù)集。該模型有三個重要的可調(diào)參數(shù)——第一參數(shù)、第二參數(shù)和第三參數(shù)。

現(xiàn)在,讓我們在下面設(shè)置這些參數(shù)的值:

第一個參數(shù)-自舉=真

第二參數(shù)-最大深度- [8,9]

第三參數(shù)-n _ 估計量:[50,100,200]

1。sklearn Gridsearch: 對于每一個參數(shù)組合,Scikit-learn Gridsearch 都會執(zhí)行任務(wù),有時最終會多次迭代單個任務(wù)。下圖表明,這并不是最有效的方法:

2。Dask-Search CV: 與 sklearn 的grid Search CV不同,Dask 提供了一個名為 Dask-Search CV 的庫。為了減少重復(fù),Dask-Search CV 合并了這些步驟。我們可以通過以下步驟安裝 Dask-search :

使用 conda 安裝 Dask-搜索 CV


conda install dask-searchcv -c conda-forge

使用 pip 安裝 Dask-搜索 CV


$ pip install dask-searchcv

下圖展示了 Dask-Search CV 的工作原理:

Spark 和 Dask 的區(qū)別

以下是 Spark 和 Dask 的一個關(guān)鍵區(qū)別:

| 南號碼 | 火花 | 達斯克 | | one | Spark 是用 Scala 編程語言編寫的。 | Dask 是用 Python 編程語言編寫的。 | | Two | Spark 提供對 R 和 Python 的支持。 | Dask 只支持 Python。 | | three | Spark 提供了自己的生態(tài)系統(tǒng)。 | Dask 是 Python 生態(tài)系統(tǒng)的組成部分之一。 | | four | Spark 提供了自己的 API。 | Dask 重新利用 Pandas 的 API | | five | 對于 Scala 和 SQL 用戶來說,Spark 很容易理解和實現(xiàn)。 | Python 從業(yè)者通常更喜歡 Dask。 | | six | Spark 本身不支持多維數(shù)組。 | Dask 為可擴展多維陣列的 NumPy 模型提供全面支持。 |

tags: python教程
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
為什么Hadoop是用Java實現(xiàn)的?

一、跨平臺能力多平臺運行:Java的“一次編寫,到處運行”理念,使得Hadoop能在各種操作系統(tǒng)和硬件上運行,不需要特定的調(diào)整。廣泛應(yīng)用:這一特...詳情>>

2023-10-15 16:51:37
ECU是什么?

1、ECU的基本定義與作用ECU,全稱為電子控制單元,是一種專門用于控制汽車各個系統(tǒng)的微處理器控制系統(tǒng)。通過接收傳感器的信號并轉(zhuǎn)換成控制指令...詳情>>

2023-10-15 16:29:54
什么是SOA?

1、SOA的基本概念與核心原則SOA是一種使軟件組件通過網(wǎng)絡(luò)進行互操作的架構(gòu)模式。核心原則包括:可發(fā)現(xiàn)的服務(wù):服務(wù)應(yīng)容易發(fā)現(xiàn)和理解。松耦合:...詳情>>

2023-10-15 16:19:32
什么是內(nèi)存池?

1、內(nèi)存池的基本概念內(nèi)存池是一種內(nèi)存管理策略,旨在優(yōu)化內(nèi)存分配性能和減少碎片化。通過將內(nèi)存分配到大小固定的池中,應(yīng)用程序可以快速、高效...詳情>>

2023-10-15 16:16:15
ci構(gòu)建與編譯的區(qū)別是什么?

一、功能與目的構(gòu)建(Build): 構(gòu)建是將源代碼轉(zhuǎn)化為可執(zhí)行代碼的過程,它包括編譯、鏈接、打包等一系列步驟。構(gòu)建不僅僅局限于編譯,還可能涉...詳情>>

2023-10-15 15:57:11
快速通道