前 17 名開源機器學習項目 [適合新手和有經驗者]
已發表: 2020-12-22人工智能和機器學習正在帶來第四次工業革命。 各行各業的各種形式和規模的企業都在採用這些顛覆性技術來設計滿足目標客戶需求的創新解決方案。
因此,對精通 AI 和 ML 細微差別的才華橫溢的專業人士有著巨大的需求。 事實上,公司已經準備好向擁有合適技能的應聘者支付高昂的費用。
鑑於對 AI 和 ML 技能的需求不斷增長,如果您擁有一些現實世界的項目,它會有所幫助。 當您從事項目時,它向潛在雇主表明您有動力和知識來使用這些技術。
如果您正在尋找鼓舞人心的開源機器學習項目,那麼您來對地方了!
目錄
開源機器學習項目
GitHub 開源機器學習項目
1. 去舊化
DeOldify 是一種深度學習模型,旨在為舊圖像著色和恢復。 您可以使用 DeOldify 為舊照片和電影素材上色,這在向它們灌輸生命方面做得非常出色! 它已經過升級,可為灰度圖像提供更詳細、更逼真的修飾。 此外,結果顯示藍色偏差顯著減少,故障最小。

2.人臉識別
這個應用程序號稱是“世界上最簡單的 Python 和命令行面部識別 API”。 它可以使用 dlib 最先進的人臉識別軟件從 Python 或命令行識別和操作人臉。 這個深度學習模型聲稱每個LFW基準的準確率達到 99.38% 。 您可以使用“face_recognition”命令行工具從命令行對圖像文件夾執行人臉識別!
3.語音克隆
這個 ML 項目是從說話人驗證到多說話人文本到語音合成(SV2TTS) 的遷移學習的實現。 SV2TTS 是一種深度學習工具,可以從任何音頻剪輯中生成語音的數字表示,並訓練文本到語音模型以推廣到新語音。 此應用程序可以在 5 秒內克隆任何聲音並實時生成任意語音!
4.神經談話2
NeuralTalk2 本質上是用 Lua 編寫的圖像捕獲代碼。 它在 GPU 上運行並且需要 Torch。 NeuralTalk2 可以利用多模態循環神經網絡為圖像/視頻加上句子的字幕。 這是社交媒體內容創建者的理想工具——您可以為圖像/視頻生成字幕,也可以使用此模型創建有趣的圖像/視頻內容(帶有有趣字幕的內容)。
閱讀:機器學習職業
5. U-GAT-IT
U-GAT-IT(用於圖像到圖像轉換的具有自適應層實例標準化的無監督生成注意力網絡)是一個簡單的機器學習項目——將人的圖像轉換為他們的動漫頭像。 該模型可以通過利用一種新穎的無監督圖像到圖像轉換技術來轉換需要整體變化的圖像和需要較大形狀變化的圖像。 不用說,這是動漫愛好者的完美項目!
6. 斯雷茲
Srez 使用深度學習來實現圖像超分辨率——它可以將 16×16 的圖像放大四倍,以生成 64×64 的照片。 結果描繪了與訓練數據集相比似乎足夠值得稱道的清晰和傑出的特徵。 底層架構包括一個 DCGAN,它接受生成器網絡的 16×16 圖像輸入,而不是多項高斯分佈。
7. 艾娃
AVA 是一個旨在提供人工智能驅動的自動化視覺分析的框架。 AVA 中的第一個“A”有多重含義——它是一個阿里巴巴框架,致力於成為“支持增強分析的自動化、人工智能驅動的解決方案”。 AVA包含三個包,分別是CKB(用於可視化/圖表的經驗知識的存儲空間)、DataWizard(數據處理庫)和ChartAdvisor(根據數據集和分析要求建議圖表的核心組件)。
8.威震天
Megatron 由 NVIDIA 的應用深度學習研究團隊開發,是一種功能強大的轉換器,可以訓練大量語言模型,以在擴展時提高其性能。 這是一個正在進行的項目,通過混合精度支持 BERT 和 GPT2 的模型並行、多節點訓練。

谷歌開源機器學習項目
9.卡利班
Caliban 是一種工具,用於在隔離且可重現的 Docker 環境中開發 ML 研究工作流程和筆記本。 最好的部分——你甚至不需要學習 Docker 的複雜性來使用 Caliban! 使用 Caliban,您可以在您的機器上構建和運行 ML 模型,並將本地代碼發送到雲端。 該工具非常適合 Pytorch、Tensorflow 和 JAX 上的 ML 工作流。
10.不豆
Budou 是專為 CJK(中文、日文和韓文)語言設計的自動換行工具。 它會自動將 CJK 文本翻譯成有組織的 HTML 代碼,從而產生漂亮的排版。 Budou 根據瀏覽器的屏幕寬度將標題和句子分成多行有意義的塊。
11. 因果影響
這個 Google 項目是一個統計庫,用於估計干預對時間序列模型的因果影響。 CausalImpact R 包使用結構化貝葉斯時間序列來確定乾預後響應指標如何演變(如果它最初沒有發生)。 例如,回答“特定營銷活動產生了多少新點擊?”之類的問題非常具有挑戰性。 不使用隨機實驗。 CausalImpact 可以幫助找到這些問題的答案。
12. DeepMind 實驗室
DeepMind Lab 是一個完全可定制的第一人稱 3D 遊戲平台,用於人工智能和機器學習系統的研發。 它由許多具有挑戰性的謎題和導航任務組成,這些任務在深度強化學習中至關重要。 DeepMind Lab 擁有簡潔靈活的 API,可讓您創建可快速迭代的創新任務設計和獨特的 AI 設計。 Google 的 DeepMind 廣泛使用 DeepMind Lab 來研究和訓練 AI/ML 學習代理。
13. 深度變體
DeepVariant是一種分析管道,它利用神經網絡從下一代 DNA 測序數據中尋找遺傳變異。 它使用Nucleus庫(包含 Python 和 C++ 代碼)以與 TensorFlow 無縫集成的常見基因組文件格式讀取和寫入數據。
14. 多巴胺
它是一個基於 TensorFlow 的研究框架,專為強化學習算法的快速原型設計而構建。 Dopamine 被設計成一個小而直觀的代碼庫,使用戶能夠嘗試激進的想法和投機性研究。 它有四個核心設計原則:
- 簡單的實驗
- 靈活發展
- 緊湊而可靠的實施
- 可重複的結果
15. 金翅雀
Goldfinch 是為解決細粒度識別挑戰而創建的數據集。 它包括不同類別的集合——鳥、蝴蝶、狗、飛機和其他類別,以及相關的 Flickr 搜索 URL 和 Google 圖片搜索。 狗類別包括許多主動學習註釋。 Google 使用 Goldfinch 探索計算機視覺和機器學習技術以解決細粒度識別問題。

16. 庫比流
Kubeflow 是專為 Kubernetes 設計的 ML 工具包。 它使在 Kubernetes 上部署機器學習 (ML) 工作流具有可移植性和可擴展性。 主要目的是提供一種簡單的方法,將一流的機器學習操作系統部署到多種不同的基礎設施。 您可以在任何運行 Kubernetes 的系統或環境上運行 Kubeflow。
17.洋紅色
這是一個研究項目,旨在探索機器學習如何創造音樂和藝術。 該項目的主要重點是構建深度學習和強化學習算法來製作歌曲、圖像、繪畫和其他創意內容。 它試圖創造智能工具,以增強藝術家和音樂家的能力和潛力。
結論
最後,我們的最後一條建議是通過這些項目並分解它們以了解更深層次的細微差別。 這將有助於豐富您的 ML 知識,並教您 ML 技術在每個項目中的工作方式有何不同。
我們希望通過深入研究這 17 個開源機器學習項目,您會找到開發自己的機器學習項目的靈感!
如果您有興趣了解有關機器學習的更多信息,請查看 IIIT-B 和 upGrad 的機器學習和人工智能 PG 文憑,該文憑專為工作專業人士設計,提供 450 多個小時的嚴格培訓、30 多個案例研究和作業、IIIT- B 校友身份、5 個以上實用的實踐頂點項目和頂級公司的工作協助。
在醫療保健中使用 AI 時會出現哪些問題?
醫學領域需要透明度和描述臨床決策的能力。 在醫療保健領域使用深度學習和其他 AI 模型非常有益,但解釋模型是一項艱鉅的任務。 AI 臨床應用還面臨某些倫理考慮,例如用於 AI 模型訓練的數據的隱私問題以及在醫療領域實施 AI 時的安全問題。
人工智能如何在時間和金錢方面降低醫療保健成本?
醫學領域的人工智能算法比傳統方法便宜。 由於在醫療保健系統中使用了人工智能技術,人們不再需要進行大量昂貴的實驗室測試。 這可以從人工智能在識別能夠檢測人體某些疾病的生物標誌物方面的潛力中看出。 這些算法確保指定這些生物標誌物的大部分手工勞動可以自動化。 通過這種方式,他們可以節省時間,這在該領域非常重要。
使用人工智能如何賦予患者權力?
可穿戴技術,如智能手錶,已經被全世界大量的人用來捕捉從睡眠模式到心率的日常健康數據。 當這些數據與機器學習相結合時,有可能在風險變得嚴重或無法治療之前很久就成功地告知個人他們是否有患某些疾病的風險。 目前,移動應用程序提供了細粒度的患者資料信息,這可以幫助患有某些慢性病的患者更好地管理他們的疾病,從而過上更健康的生活。 通過這種方法,人工智能有可能使我們能夠為自己做出更好的健康決策。