17 лучших проектов машинного обучения с открытым исходным кодом [для новичков и опытных]

Опубликовано: 2020-12-22

Искусственный интеллект и машинное обучение ведут к четвертой промышленной революции. Компании всех форм и размеров во всех отраслях используют эти прорывные технологии для разработки инновационных решений, отвечающих требованиям своих целевых клиентов.

Следовательно, существует огромный спрос на талантливых профессионалов, которые хорошо разбираются в нюансах искусственного интеллекта и машинного обучения. На самом деле компании готовы платить большие деньги достойным кандидатам с нужным набором навыков.

В свете растущего спроса на навыки искусственного интеллекта и машинного обучения полезно, если у вас есть несколько реальных проектов за плечами. Когда вы работаете над проектами, это показывает потенциальным работодателям, что у вас есть стремление и знания, чтобы освоить эти технологии.

Если вы ищете вдохновляющие проекты машинного обучения с открытым исходным кодом, вы попали по адресу!

Оглавление

Проекты машинного обучения с открытым исходным кодом
- 1. Дестаризация
- 2. Распознавание лиц
- 3. Клонирование голоса
- 4. Нейронный разговор2
- 5. У-ГАТ-ИТ
- 6. Срез
- 7. АВА
- 8. Мегатрон
- 9. Калибан
- 10. Буду
- 11. Причинное воздействие
- 12. Лаборатория DeepMind
- 13. Глубокий вариант
- 14. Дофамин
- 15. Щегол
- 16. Кубефлоу
- 17. Пурпурный
Заключение
Какие проблемы возникают при использовании ИИ в здравоохранении?
Как ИИ делает здравоохранение менее затратным с точки зрения времени и денег?
Как использование ИИ расширяет возможности пациентов?

Проекты машинного обучения с открытым исходным кодом

Проекты машинного обучения GitHub с открытым исходным кодом

1. Дестаризация

DeOldify — это модель глубокого обучения, предназначенная для раскрашивания и восстановления старых изображений. Вы можете раскрашивать старые фотографии и видеоматериалы с помощью DeOldify, который отлично помогает вдохнуть в них жизнь! Он был обновлен, чтобы обеспечить более детализированные и реалистичные ретуши изображений в градациях серого. Кроме того, результаты показывают значительно меньше синего смещения с минимальными сбоями.

2. Распознавание лиц

Это приложение может похвастаться тем, что является «самым простым в мире API распознавания лиц для Python и командной строки». Он может распознавать лица и управлять ими из Python или командной строки, используя передовое программное обеспечение для распознавания лиц от dlib. Эта модель глубокого обучения утверждает, что имеет точность 99,38% в соответствии с тестом LFW . Вы можете использовать инструмент командной строки «face_recognition», чтобы выполнить распознавание лиц в папке с изображениями из командной строки!

3. Клонирование голоса

Этот проект машинного обучения представляет собой реализацию переноса обучения с проверки говорящего на синтез речи с несколькими говорящими (SV2TTS). SV2TTS — это инструмент глубокого обучения, который может генерировать числовое представление голоса из любого аудиоклипа и обучать модель преобразования текста в речь для обобщения новых голосов. Это приложение может клонировать любой голос за 5 секунд и воспроизводить произвольную речь в режиме реального времени!

4. Нейронный разговор2

NeuralTalk2 — это, по сути, код захвата изображения, написанный на Lua. Он работает на графическом процессоре и требует Torch. NeuralTalk2 может подписывать изображения/видео предложениями, используя мультимодальную рекуррентную нейронную сеть. Это идеальный инструмент для создателей контента в социальных сетях — вы можете создавать субтитры для своих изображений/видео, а также использовать эту модель для создания забавного изображения/видеоконтента (с забавными субтитрами).

Читайте: Карьера в машинном обучении

5. У-ГАТ-ИТ

U-GAT-IT (неконтролируемые генеративные сети внимания с адаптивной нормализацией уровня-экземпляра для преобразования изображения в изображение) — это проект машинного обучения с простой целью — перевести изображение человека в его аниме-аватар. Эта модель может преобразовывать изображения, требующие целостных изменений, и изображения, требующие больших вариаций формы, используя новую неконтролируемую технику преобразования изображения в изображение. Излишне говорить, что это идеальный проект для любителей аниме!

6. Срез

Srez использует глубокое обучение для сверхвысокого разрешения изображений — он может масштабировать изображения 16 × 16 в четыре раза по сравнению с их разрешением для создания фотографий 64 × 64. Результаты отображают четкие и отличительные черты, которые кажутся достаточно похвальными по сравнению с набором обучающих данных. Базовая архитектура включает в себя DCGAN, которая принимает входные изображения 16 × 16 в сеть генератора вместо полиномиального гауссовского распределения.

7. АВА

AVA — это платформа, целью которой является предоставление автоматизированной визуальной аналитики на основе искусственного интеллекта. Первая буква «А» в AVA имеет несколько значений — это платформа Alibaba, которая стремится стать «автоматизированным решением на основе ИИ, поддерживающим расширенную аналитику». AVA включает в себя три пакета, а именно CKB (хранилище эмпирических знаний для визуализации/диаграмм), DataWizard (библиотека обработки данных) и ChartAdvisor (основной компонент, предлагающий диаграммы в соответствии с набором данных и требованиями анализа).

8. Мегатрон

Разработанный исследовательской группой NVIDIA по прикладному глубокому обучению, Megatron представляет собой мощный преобразователь, который может обучать объемные языковые модели для повышения их производительности по мере их масштабирования. Это текущий проект, который поддерживает параллельное с моделью многоузловое обучение BERT и GPT2 с помощью смешанной точности.

Проекты машинного обучения Google с открытым исходным кодом

9. Калибан

Caliban — это инструмент, предназначенный для разработки исследовательских рабочих процессов и блокнотов машинного обучения в изолированных и воспроизводимых средах Docker. Самое приятное то, что вам даже не нужно изучать тонкости Docker, чтобы использовать Caliban! Caliban позволяет создавать и запускать модели машинного обучения на своем компьютере, а также отправлять локальный код в облако. Этот инструмент идеально подходит для рабочих процессов машинного обучения в Pytorch, Tensorflow и JAX.

10. Буду

Budou — это инструмент автоматического разрыва строк, разработанный для языков CJK (китайский, японский и корейский). Он автоматически переводит текст CJK в организованный HTML-код, в результате чего получается красивая типографика. Budou разбивает заголовки и предложения на несколько строк осмысленных фрагментов в соответствии с шириной экрана браузера.

11. Причинное воздействие

Этот проект Google представляет собой библиотеку статистики, которая оценивает причинно-следственный эффект вмешательства на модель временного ряда. Пакет CausalImpact R использует структурный байесовский временной ряд, чтобы определить, как изменяется показатель отклика после вмешательства, если оно не произошло изначально. Например, довольно сложно ответить на такой вопрос, как «сколько новых кликов сгенерировала конкретная маркетинговая кампания?» без использования рандомизированного эксперимента. CausalImpact может помочь найти ответы на такие вопросы.

12. Лаборатория DeepMind

DeepMind Lab — это полностью настраиваемая трехмерная игровая платформа от первого лица для исследований и разработок систем искусственного интеллекта и машинного обучения. Он состоит из множества сложных головоломок и навигационных задач, которые играют ключевую роль в глубоком обучении с подкреплением. DeepMind Lab имеет аккуратный и гибкий API, который позволяет создавать инновационные проекты задач и уникальные проекты ИИ, которые можно быстро повторять. DeepMind от Google широко использует DeepMind Lab для исследования и обучения обучающих агентов AI/ML.

13. Глубокий вариант

DeepVariant — это конвейер анализа, который использует нейронную сеть для поиска генетических вариантов из данных секвенирования ДНК следующего поколения. Он использует библиотеку Nucleus (содержащую код Python и C++) для чтения и записи данных в распространенных форматах файлов геномики, которые легко интегрируются с TensorFlow.

14. Дофамин

Это исследовательская среда на основе TensorFlow, созданная для быстрого прототипирования алгоритмов обучения с подкреплением. Dopamine был разработан как небольшая и интуитивно понятная кодовая база, которая позволяет пользователям экспериментировать с радикальными идеями и спекулятивными исследованиями. Он имеет четыре основных принципа проектирования:

Простое экспериментирование
Гибкая разработка
Компактная и надежная реализация
Воспроизводимые результаты

15. Щегол

Goldfinch — это набор данных, созданный для решения мелких задач распознавания. Он включает в себя набор различных категорий — птицы, бабочки, собаки, самолеты и другие категории, а также соответствующие URL-адреса поиска Flickr и поиск изображений Google. Категория собак включает в себя многочисленные аннотации активного обучения. Google использует Goldfinch для изучения методов компьютерного зрения и машинного обучения для решения мелких задач распознавания.

16. Кубефлоу

Kubeflow — это набор инструментов машинного обучения, разработанный специально для Kubernetes. Это делает развертывание рабочих процессов машинного обучения (ML) в Kubernetes переносимым и масштабируемым. Основная цель — предложить простой способ развертывания лучшей в своем классе ОС для машинного обучения в нескольких и разнообразных инфраструктурах. Вы можете запустить Kubeflow в любой системе или среде, где работает Kubernetes.

17. Пурпурный

Это исследовательский проект, разработанный для изучения роли машинного обучения в создании музыки и искусства. Основное внимание в этом проекте уделяется созданию алгоритмов глубокого обучения и обучения с подкреплением для создания песен, изображений, рисунков и другого творческого контента. Это попытка создать интеллектуальные инструменты, расширяющие возможности и потенциал художников и музыкантов.

Заключение

В заключение, наш последний совет — пройтись по этим проектам и разбить их на части, чтобы понять более глубокие нюансы. Это поможет обогатить ваши знания в области машинного обучения и научит вас тому, как технологии машинного обучения работают по-разному в каждом проекте.

Мы надеемся, что, углубившись в эти 17 проектов машинного обучения с открытым исходным кодом, вы найдете вдохновение для разработки собственного проекта машинного обучения!

Если вам интересно узнать больше о машинном обучении, ознакомьтесь с дипломом PG IIIT-B и upGrad в области машинного обучения и искусственного интеллекта, который предназначен для работающих профессионалов и предлагает более 450 часов тщательного обучения, более 30 тематических исследований и заданий, IIIT- Статус B Alumni, более 5 практических практических проектов и помощь в трудоустройстве в ведущих фирмах.

Какие проблемы возникают при использовании ИИ в здравоохранении?

Область медицины требует прозрачности и способности описывать клинические решения. Использование глубокого обучения и других моделей искусственного интеллекта в сфере здравоохранения очень полезно, но объяснить эти модели довольно сложно. Существуют также определенные этические соображения, с которыми сталкиваются клинические приложения ИИ, такие как проблемы конфиденциальности данных, используемых для обучения модели ИИ, и проблемы безопасности при внедрении ИИ в медицинскую область.

Как ИИ делает здравоохранение менее затратным с точки зрения времени и денег?

Алгоритмы ИИ в области медицины менее затратны, чем традиционные подходы. Людям больше не нужно проходить множество дорогостоящих лабораторных анализов благодаря использованию технологии ИИ в системе здравоохранения. Это можно увидеть в потенциале ИИ в выявлении биомаркеров, способных обнаруживать определенные нарушения в организме человека. Алгоритмы гарантируют, что большая часть ручного труда по определению этих биомаркеров может быть автоматизирована. Таким образом, они экономят время, что очень важно в этой области.

Как использование ИИ расширяет возможности пациентов?

Носимые технологии, такие как смарт-часы, уже используются огромным количеством людей во всем мире для сбора ежедневных данных о состоянии здоровья, начиная от режима сна и заканчивая частотой сердечных сокращений. Когда эти данные объединяются с машинным обучением, можно успешно информировать людей о том, подвержены ли они риску определенных заболеваний, задолго до того, как риск станет серьезным или неизлечимым. В настоящее время мобильные приложения предоставляют детализированную информацию о профиле пациента, которая может помочь пациентам, живущим с определенными хроническими заболеваниями, лучше справляться со своим заболеванием и, таким образом, жить более здоровой жизнью. При таком подходе искусственный интеллект может дать нам возможность принимать более эффективные решения в отношении собственного здоровья.