상위 17개 오픈 소스 머신 러닝 프로젝트 [초보자 및 경험자용]
게시 됨: 2020-12-22인공지능과 머신러닝이 4차 산업혁명을 일으키고 있습니다. 모든 산업 분야에서 모든 형태와 규모의 기업이 이러한 파괴적인 기술을 수용하여 대상 고객의 요구 사항을 충족하는 혁신적인 솔루션을 설계하고 있습니다.
결과적으로 AI와 ML의 미묘한 차이에 정통한 재능 있는 전문가에 대한 수요가 많습니다. 사실, 기업은 적절한 기술을 갖춘 자격이 있는 후보자에게 최고의 비용을 지불할 준비가 되어 있습니다.
AI 및 ML 기술에 대한 수요 증가에 비추어 볼 때 몇 가지 실제 프로젝트가 있는 경우 도움이 됩니다. 프로젝트에서 작업할 때 잠재적인 고용주에게 이러한 기술을 쉽게 사용할 수 있는 추진력과 지식이 있음을 보여줍니다.
영감을 주는 오픈 소스 머신 러닝 프로젝트를 찾고 있다면 올바른 장소를 발견한 것입니다!
목차
오픈 소스 머신 러닝 프로젝트
GitHub 오픈 소스 머신 러닝 프로젝트
1. 디올디파이
DeOldify는 오래된 이미지를 색칠하고 복원하도록 설계된 딥 러닝 모델입니다. DeOldify를 사용하여 오래된 사진과 필름 영상에 생명을 불어넣는 환상적인 작업을 수행하여 색상을 지정할 수 있습니다! 그레이스케일 이미지에 보다 상세하고 사실적인 수정을 제공하도록 업그레이드되었습니다. 또한 결과는 최소한의 결함으로 블루 바이어스가 상당히 적은 것으로 나타났습니다.

2. 안면 인식
이 응용 프로그램은 "세계에서 가장 간단한 Python 및 명령줄용 얼굴 인식 API"를 자랑합니다. dlib의 최신 얼굴 인식 소프트웨어를 사용하여 Python 또는 명령줄에서 얼굴을 인식하고 조작할 수 있습니다. 이 딥 러닝 모델은 LFW 벤치마크 당 99.38%의 정확도를 가지고 있다고 주장합니다 . "face_recognition" 명령줄 도구를 사용하여 명령줄에서 이미지 폴더에 대한 얼굴 인식을 수행할 수 있습니다!
3. 음성 복제
이 ML 프로젝트는 화자 검증에서 다중 화자 텍스트 음성 변환 (SV2TTS)으로의 전이 학습 구현입니다. SV2TTS는 모든 오디오 클립에서 음성의 숫자 표현을 생성하고 새로운 음성으로 일반화하도록 텍스트 음성 변환 모델을 훈련할 수 있는 딥 러닝 도구입니다. 이 응용 프로그램은 5초 안에 모든 음성을 복제하고 실시간으로 임의의 음성을 생성할 수 있습니다!
4. 뉴럴톡2
NeuralTalk2는 본질적으로 Lua로 작성된 이미지 캡처 코드입니다. GPU에서 실행되며 Torch가 필요합니다. NeuralTalk2는 Multimodal Recurrent Neural Network를 활용하여 문장으로 이미지/비디오에 캡션을 지정할 수 있습니다. 이것은 소셜 미디어 콘텐츠 제작자에게 이상적인 도구입니다. 이미지/비디오에 대한 자막을 생성할 수 있으며 이 모델을 사용하여 재미있는 이미지/비디오 콘텐츠(재미있는 자막이 있는 콘텐츠)를 만들 수도 있습니다.
읽기: 기계 학습 경력
5. 유갓잇
U-GAT-IT(이미지에서 이미지로의 변환을 위한 적응형 계층 인스턴스 정규화를 포함하는 감독되지 않은 생성 주의력 네트워크)는 사람의 이미지를 애니메이션 아바타로 변환하는 간단한 초점을 가진 ML 프로젝트입니다. 이 모델은 새로운 비지도 이미지 대 이미지 번역 기술을 활용하여 전체적인 변화가 필요한 이미지와 큰 모양 변화가 필요한 이미지를 변환할 수 있습니다. 말할 필요도 없이 이것은 애니메이션 애호가를 위한 완벽한 프로젝트입니다!
6. 스레즈
Srez는 이미지 초해상도를 위해 딥 러닝을 사용합니다. 16×16 이미지를 해상도의 4배로 확장하여 64×64 사진을 생성할 수 있습니다. 결과는 훈련 데이터 세트와 비교할 때 충분히 칭찬할 만해 보이는 선명하고 구별되는 기능을 나타냅니다. 기본 아키텍처에는 다항 가우스 분포 대신 생성기 네트워크에 대한 16x16 이미지 입력을 허용하는 DCGAN이 포함됩니다.
7. 아바
AVA는 AI 기반의 자동화된 시각적 분석을 제공하는 것을 목표로 하는 프레임워크입니다. AVA의 첫 번째 "A"는 여러 의미를 내포하고 있습니다. 이는 "증강 분석을 지원하는 자동화된 AI 기반 솔루션"이 되기 위해 노력하는 Alibaba 프레임워크입니다. AVA는 CKB(시각화/차트에 대한 경험적 지식을 위한 저장 공간), DataWizard(데이터 처리 라이브러리), ChartAdvisor(데이터 세트 및 분석 요구 사항에 따라 차트를 제안하는 핵심 구성 요소)의 세 가지 패키지를 포함합니다.
8. 메가트론
NVIDIA의 Applied Deep Learning Research 팀에서 개발한 Megatron은 방대한 언어 모델을 훈련하여 확장에 따라 성능을 향상시킬 수 있는 강력한 변환기입니다. 혼합 정밀도를 통해 BERT 및 GPT2의 모델 병렬, 다중 노드 교육을 지원하는 진행 중인 프로젝트입니다.

Google 오픈 소스 머신 러닝 프로젝트
9. 칼리반
Caliban은 격리되고 재현 가능한 Docker 환경에서 ML 연구 워크플로 및 노트북을 개발하도록 설계된 도구입니다. 가장 좋은 점은 Caliban을 사용하기 위해 Docker의 복잡성을 배울 필요조차 없다는 것입니다! Caliban을 사용하면 머신에서 ML 모델을 구축 및 실행할 수 있으며 로컬 코드를 클라우드로 전달할 수도 있습니다. 이 도구는 Pytorch, Tensorflow 및 JAX의 ML 워크플로에 적합합니다.
10. 부도
Budou는 CJK(중국어, 일본어 및 한국어) 언어용으로 설계된 자동 줄 바꿈 도구입니다. CJK 텍스트를 조직화된 HTML 코드로 자동 변환하여 아름다운 타이포그래피를 생성합니다. Budou는 제목과 문장을 브라우저의 화면 너비에 따라 의미 있는 청크로 여러 줄로 나눕니다.
11. 인과적 영향
이 Google 프로젝트는 시계열 모델에 대한 개입의 인과 영향을 추정하는 통계 라이브러리입니다. CausalImpact R 패키지는 구조적 베이지안 시계열을 사용하여 처음에 발생하지 않은 경우 개입 후 응답 메트릭이 어떻게 진화하는지 결정합니다. 예를 들어, "특정 마케팅 캠페인에서 얼마나 많은 새로운 클릭이 발생했습니까?"와 같은 질문에 답하는 것은 매우 어렵습니다. 무작위 실험을 사용하지 않고 CausalImpact는 이러한 질문에 대한 답을 찾는 데 도움이 될 수 있습니다.
12. 딥마인드 연구실
DeepMind Lab은 인공 지능 및 기계 학습 시스템의 R&D를 위한 완전히 사용자 정의 가능한 1인칭 3D 게임 플랫폼입니다. 이는 심층 강화 학습에서 중추적인 여러 도전적인 퍼즐과 탐색 작업으로 구성됩니다. DeepMind Lab에는 신속하게 반복할 수 있는 혁신적인 작업 설계 및 고유한 AI 설계를 생성할 수 있는 깔끔하고 유연한 API가 있습니다. Google의 DeepMind는 DeepMind Lab을 광범위하게 사용하여 AI/ML 학습 에이전트를 연구하고 교육합니다.
13. DeepVariant
DeepVariant 는 신경망을 활용하여 차세대 DNA 시퀀싱 데이터에서 유전적 변이를 찾는 분석 파이프라인입니다. Nucleus 라이브러리(Python 및 C++ 코드 포함)를 사용 하여 TensorFlow와 원활하게 통합되는 일반적인 유전체학 파일 형식으로 데이터를 읽고 씁니다.
14. 도파민
강화 학습 알고리즘의 빠른 프로토타이핑을 위해 구축된 TensorFlow 기반 연구 프레임워크입니다. 도파민은 사용자가 급진적인 아이디어와 추측적인 연구를 실험할 수 있도록 하는 작고 직관적인 코드베이스로 설계되었습니다. 4가지 핵심 설계 원칙이 있습니다.
- 쉬운 실험
- 유연한 개발
- 컴팩트하고 안정적인 구현
- 재현 가능한 결과
15. 금붕어
Goldfinch는 세분화된 인식 문제를 해결하기 위해 생성된 데이터세트입니다. 여기에는 관련 Flickr 검색 URL 및 Google 이미지 검색과 함께 새, 나비, 개, 항공기 및 기타 카테고리의 다양한 카테고리 모음이 포함됩니다. 개 카테고리에는 수많은 활성 학습 주석이 포함되어 있습니다. Google은 Goldfinch를 사용하여 세분화된 인식 문제에 대한 컴퓨터 비전 및 기계 학습 기술을 탐색합니다.

16. 큐브플로우
Kubeflow는 Kubernetes 전용으로 설계된 ML 툴킷입니다. 이를 통해 Kubernetes에 기계 학습(ML) 워크플로를 배포하고 확장할 수 있습니다. 주요 목표는 동급 최강의 ML용 OS를 여러 다양한 인프라에 배포하는 간단한 방법을 제공하는 것입니다. Kubernetes를 실행하는 모든 시스템 또는 환경에서 Kubeflow를 실행할 수 있습니다.
17. 마젠타
이것은 기계 학습이 음악과 예술을 만드는 방법을 탐구하기 위해 개발된 연구 프로젝트입니다. 이 프로젝트의 주요 초점은 노래, 이미지, 그림 및 기타 창의적인 콘텐츠를 생성하기 위한 딥 러닝 및 강화 학습 알고리즘을 구축하는 것입니다. 예술가와 음악가의 능력과 잠재력을 향상시키는 지능형 도구를 만들려는 시도입니다.
결론
마무리로, 우리의 마지막 조언은 이러한 프로젝트를 살펴보고 더 깊은 뉘앙스를 이해하기 위해 분해하는 것입니다. 이는 ML 지식을 풍부하게 하고 ML 기술이 각 프로젝트에서 어떻게 다르게 작동하는지 알려줍니다.
이 17개의 오픈 소스 머신 러닝 프로젝트에 대해 더 깊이 파고들어 자신만의 머신 러닝 프로젝트를 개발할 수 있는 영감을 얻으시기 바랍니다!
기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.
의료에서 AI를 사용하는 동안 발생하는 문제는 무엇입니까?
의학 분야는 투명성과 임상 결정을 설명하는 능력을 요구합니다. 의료 부문에서 딥 러닝 및 기타 AI 모델을 사용하는 것은 매우 유용하지만 모델을 설명하는 것은 상당히 어려운 작업입니다. 의료 분야에서 AI를 구현하는 동안 AI 모델 교육 및 보안 문제에 사용되는 데이터에 대한 개인 정보 보호 문제와 같이 AI 임상 애플리케이션이 직면하는 특정 윤리적 고려 사항도 있습니다.
AI는 시간과 비용 측면에서 의료 비용을 어떻게 낮추나요?
의학 분야의 AI 알고리즘은 기존 접근 방식보다 저렴합니다. 의료 시스템에서 AI 기술을 사용하기 때문에 사람들은 더 이상 값비싼 실험실 테스트를 많이 받을 필요가 없습니다. 이것은 인체의 특정 장애를 감지할 수 있는 바이오마커를 식별하는 AI의 잠재력에서 볼 수 있습니다. 알고리즘은 이러한 바이오마커를 지정하는 대부분의 수작업이 자동화될 수 있도록 합니다. 이러한 방식으로 이 분야에서 매우 중요한 시간을 절약할 수 있습니다.
AI를 사용하면 어떻게 환자에게 힘을 실어줄 수 있습니까?
스마트 시계와 같은 웨어러블 기술은 이미 전 세계적으로 수많은 사람들이 수면 패턴에서 심박수에 이르는 일일 건강 데이터를 캡처하는 데 사용하고 있습니다. 이 데이터가 기계 학습과 결합되면 위험이 심각해지거나 치료할 수 없게 되기 훨씬 전에 특정 질병의 위험이 있는지 여부를 개인에게 성공적으로 알리는 것이 가능할 수 있습니다. 현재 모바일 애플리케이션은 세분화된 수준의 환자 프로필 정보를 제공하여 특정 만성 질환을 앓고 있는 환자가 질병을 더 잘 관리하여 더 건강한 삶을 사는 데 도움이 될 수 있습니다. 이 접근 방식을 통해 AI는 우리가 스스로 더 나은 건강 결정을 내릴 수 있도록 권한을 부여할 수 있습니다.