トップ17のオープンソース機械学習プロジェクト[初心者および経験者向け]

公開: 2020-12-22

人工知能と機械学習は、第4次産業革命をもたらしています。 あらゆる業界のあらゆる形態と規模の企業が、これらの破壊的テクノロジーを採用して、ターゲット顧客の要求に応える革新的なソリューションを設計しています。

その結果、AIとMLのニュアンスに精通した才能のある専門家に対する大きな需要があります。 実際、企業は適切なスキルセットを備えた価値のある候補者に最高額を支払う準備ができています。

AIとMLのスキルに対する需要が高まっていることを考えると、実際のプロジェクトがいくつかある場合に役立ちます。 あなたがプロジェクトに取り組むとき、それはあなたがこれらの技術を手に入れるための意欲と知識を持っていることを潜在的な雇用者に示します。

刺激的なオープンソースの機械学習プロジェクトを探しているなら、あなたは正しい場所に出くわしました!

目次

オープンソースの機械学習プロジェクト

GitHubオープンソースの機械学習プロジェクト

1.DeOldify

DeOldifyは、古い画像を色付けして復元するために設計された深層学習モデルです。 古い写真やフィルムの映像をDeOldifyで色付けすることができます。これは、それらに生命を吹き込む素晴らしい仕事をします。 グレースケール画像に、より詳細でリアルなレタッチを提供するようにアップグレードされました。 さらに、結果は、グリッチが最小限で、ブルーバイアスがかなり少ないことを示しています。

2.顔認識

このアプリケーションは、「Pythonおよびコマンドライン用の世界で最も単純な顔認識API」であることを誇っています。 dlibの最先端の顔認識ソフトウェアを使用して、Pythonまたはコマンドラインから顔を認識して操作できます。 この深層学習モデルは、 LFWベンチマークごとに99.38%の精度を持っていると主張しています。 「face_recognition」コマンドラインツールを使用して、コマンドラインから画像フォルダの顔認識を実行できます。

3.音声クローン

このMLプロジェクトは、スピーカー検証からマルチスピーカーテキスト読み上げ合成(SV2TTS)への転移学習の実装です。 SV2TTSは、任意のオーディオクリップから音声の数値表現を生成し、テキスト読み上げモデルをトレーニングして新しい音声に一般化できるディープラーニングツールです。 このアプリケーションは、5秒で任意の音声のクローンを作成し、任意の音声をすべてリアルタイムで生成できます。

4. NeuralTalk2

NeuralTalk2は、基本的にLuaで記述された画像キャプチャコードです。 GPUで実行され、トーチが必要です。 NeuralTalk2は、マルチモーダルリカレントニューラルネットワークを活用して、画像や動画に文章でキャプションを付けることができます。 これは、ソーシャルメディアコンテンツの作成者にとって理想的なツールです。画像/動画の字幕を生成できます。また、このモデルを使用して、面白い画像/動画コンテンツ(面白い字幕付きのもの)を作成することもできます。

読む:機械学習のキャリア

5.U-GAT-IT

U-GAT-IT(画像から画像への変換のための適応型レイヤーインスタンス正規化を備えた教師なし生成的注意ネットワーク)は、人の画像をアニメのアバターに変換するという単純な焦点を持ったMLプロジェクトです。 このモデルは、新しい教師なし画像間変換技術を活用することにより、全体的な変化を必要とする画像と大きな形状変化を必要とする画像を変換できます。 言うまでもなく、これはアニメ愛好家にとって完璧なプロジェクトです!

6.スレズ

Srezは、画像の超解像にディープラーニングを使用しています。16×16の画像を解像度の4倍に拡大して、64×64の写真を生成できます。 結果は、トレーニングデータセットと比較して十分に称賛に値するように見えるシャープで際立った特徴を示しています。 基盤となるアーキテクチャには、多項ガウス分布の代わりに、ジェネレータネットワークへの16×16の画像入力を受け入れるDCGANが含まれています。

7.AVA

AVAは、AIを活用した自動化されたビジュアル分析を提供することを目的としたフレームワークです。 AVAの最初の「A」には複数の意味があります。これは「拡張分析をサポートする自動化されたAI主導のソリューション」になることを目指しているAlibabaフレームワークです。 AVAには、CKB(視覚化/グラフの経験的知識のためのストレージスペース)、DataWizard(データ処理ライブラリ)、およびChartAdvisor(データセットと分析の要件に従ってグラフを提案するコアコンポーネント)の3つのパッケージが含まれています。

8.メガトロン

NVIDIAのAppliedDeepLearning Researchチームによって開発されたMegatronは、大量の言語モデルをトレーニングして、スケールアップ時にパフォーマンスを向上させることができる強力なトランスフォーマーです。 これは、混合精度を介したBERTおよびGPT2のモデル並列マルチノードトレーニングをサポートする進行中のプロジェクトです。

Googleオープンソースの機械学習プロジェクト

9.キャリバン

Calibanは、分離された再現可能なDocker環境でMLリサーチワークフローとノートブックを開発するために設計されたツールです。 最良の部分– Calibanを使用するために、Dockerの複雑さを学ぶ必要さえありません! Calibanを使用すると、マシン上でMLモデルを構築して実行し、ローカルコードをクラウドに送信することもできます。 このツールは、Pytorch、Tensorflow、およびJAXでのMLワークフローに最適です。

10.武道

Budouは、CJK(中国語、日本語、韓国語)言語用に設計された自動改行ツールです。 CJKテキストを整理されたHTMLコードに自動的に変換し、美しいタイポグラフィを実現します。 Budouは、ブラウザの画面幅ごとに、見出しと文を意味のあるチャンクの複数の行に断片化します。

11.CausalImpact

このGoogleプロジェクトは、時系列モデルに対する介入の因果効果を推定する統計ライブラリです。 CausalImpact Rパッケージは、構造的なベイズ時系列を使用して、最初に発生していなかった場合に、介入後に応答メトリックがどのように変化するかを決定します。 たとえば、「特定のマーケティングキャンペーンで何回の新規クリックが発生したか」などの質問に答えるのは非常に困難です。 ランダム化実験を使用せずに。 CausalImpactは、そのような質問に対する答えを見つけるのに役立ちます。

12. DeepMind Lab

DeepMind Labは、人工知能と機械学習システムの研究開発のための、完全にカスタマイズ可能な一人称3Dゲームプラットフォームです。 これは、深層強化学習で極めて重要な、挑戦的なパズルとナビゲーションタスクのホストで構成されています。 DeepMind Labには、すっきりとした柔軟なAPIがあり、革新的なタスク設計と、迅速に反復できる独自のAI設計を作成できます。 GoogleのDeepMindは、DeepMind Labを幅広く使用して、AI/ML学習エージェントの調査とトレーニングを行っています。

13. DeepVariant

DeepVariantは、ニューラルネットワークを活用して、次世代のDNAシーケンシングデータから遺伝的変異を見つける分析パイプラインです。 Nucleusライブラリ(PythonおよびC ++コードを含む)を使用して、TensorFlowとシームレスに統合される一般的なゲノミクスファイル形式でデータを読み書きします。

14.ドーパミン

これは、強化学習アルゴリズムのラピッドプロトタイピング用に構築されたTensorFlowベースのリサーチフレームワークです。 ドーパミンは、ユーザーが急進的なアイデアや投機的な研究を試すことができる、小さくて直感的なコードベースとして設計されました。 これには、4つの主要な設計原則があります。

  • 簡単な実験
  • 柔軟な開発
  • コンパクトで信頼性の高い実装
  • 再現性のある結果

15.ゴールドフィンチ

Goldfinchは、きめ細かい認識の課題を解決するために作成されたデータセットです。 これには、鳥、蝶、犬、航空機、その他のカテゴリのコレクションと、関連するFlickr検索URLおよびGoogle画像検索が含まれています。 犬のカテゴリには、多数のアクティブラーニング注釈が含まれています。 Googleは、Goldfinchを使用して、きめ細かい認識問題のためのコンピュータービジョンと機械学習の手法を調査しています。

16.Kubeflow

Kubeflowは、Kubernetes専用に設計されたMLツールキットです。 これにより、Kubernetesでの機械学習(ML)ワークフローのデプロイがポータブルでスケーラブルになります。 主な目的は、ML用のクラス最高のOSを複数のさまざまなインフラストラクチャに展開する簡単な方法を提供することです。 Kubeflowは、Kubernetesを実行している任意のシステムまたは環境で実行できます。

17.マゼンタ

これは、機械学習が音楽やアートを作成する方法を探求するために開発された研究プロジェクトです。 このプロジェクトの主な焦点は、歌、画像、描画、およびその他の創造的なコンテンツを生成するための深層学習および強化学習アルゴリズムを構築することです。 これは、アーティストやミュージシャンの能力と可能性を高めるインテリジェントなツールを作成する試みです。

結論

最後に、最後のアドバイスは、これらのプロジェクトを実行し、それらを分解して、より深いニュアンスを理解することです。 これは、MLの知識を深め、各プロジェクトでMLテクノロジーがどのように異なるかを教えるのに役立ちます。

これらの17のオープンソース機械学習プロジェクトを深く掘り下げることで、独自の機械学習プロジェクトを開発するためのインスピレーションが得られることを願っています。

機械学習について詳しく知りたい場合は、IIIT-BとupGradの機械学習とAIのPGディプロマをご覧ください。これは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディと課題、IIIT-を提供します。 B卒業生のステータス、5つ以上の実践的なキャップストーンプロジェクト、トップ企業との仕事の支援。

ヘルスケアでAIを使用しているときに発生する問題は何ですか?

医学の分野では、透明性と臨床的決定を説明する能力が求められます。 ヘルスケア分野でディープラーニングやその他のAIモデルを使用することは非常に有益ですが、モデルを説明することは非常に困難です。 AIモデルのトレーニングに使用されるデータのプライバシーの懸念や、医療分野でのAIの実装中のセキュリティの懸念など、AIの臨床アプリケーションが直面する特定の倫理的考慮事項もあります。

AIはどのようにして時間とお金の面で医療費を安くしますか?

医学分野のAIアルゴリズムは、従来のアプローチよりも安価です。 医療システムでAIテクノロジーが使用されているため、費用のかかるラボテストを何度も受ける必要がなくなりました。 これは、人体の特定の障害を検出できるバイオマーカーを特定する際のAIの可能性に見ることができます。 アルゴリズムにより、これらのバイオマーカーを指定する際の手作業の大部分が自動化されることが保証されます。 このようにして、この分野で非常に重要な時間を節約できます。

AIの使用はどのように患者に力を与えますか?

スマートウォッチなどのウェアラブルテクノロジーは、睡眠パターンから心拍数に至るまでの毎日の健康データをキャプチャするために、世界中の膨大な数の個人によってすでに使用されています。 このデータを機械学習と組み合わせると、リスクが深刻になるか治療不能になるずっと前に、特定の病気のリスクがあるかどうかを個人にうまく知らせることができる場合があります。 現在、モバイルアプリケーションは、詳細レベルの患者プロファイル情報を提供します。これは、特定の慢性疾患を抱える患者が病気をより適切に管理し、それによってより健康的な生活を送るのに役立つ可能性があります。 このアプローチにより、AIは、私たち自身がより良い健康上の決定を下せるようにする可能性を秘めています。