前 17 名开源机器学习项目 [适合新手和有经验者]
已发表: 2020-12-22人工智能和机器学习正在带来第四次工业革命。 各行各业的各种形式和规模的企业都在采用这些颠覆性技术来设计满足目标客户需求的创新解决方案。
因此,对精通 AI 和 ML 细微差别的才华横溢的专业人士有着巨大的需求。 事实上,公司已经准备好向拥有合适技能的应聘者支付高昂的费用。
鉴于对 AI 和 ML 技能的需求不断增长,如果您拥有一些现实世界的项目,它会有所帮助。 当您从事项目时,它向潜在雇主表明您有动力和知识来使用这些技术。
如果您正在寻找鼓舞人心的开源机器学习项目,那么您来对地方了!
目录
开源机器学习项目
GitHub 开源机器学习项目
1. 去旧化
DeOldify 是一种深度学习模型,旨在为旧图像着色和恢复。 您可以使用 DeOldify 为旧照片和电影素材上色,这在向它们灌输生命方面做得非常出色! 它已经过升级,可为灰度图像提供更详细、更逼真的修饰。 此外,结果显示蓝色偏差显着减少,故障最小。

2.人脸识别
这个应用程序号称是“世界上最简单的 Python 和命令行面部识别 API”。 它可以使用 dlib 最先进的人脸识别软件从 Python 或命令行识别和操作人脸。 这个深度学习模型声称每个LFW基准的准确率达到 99.38% 。 您可以使用“face_recognition”命令行工具从命令行对图像文件夹执行人脸识别!
3.语音克隆
这个 ML 项目是从说话人验证到多说话人文本到语音合成(SV2TTS) 的迁移学习的实现。 SV2TTS 是一种深度学习工具,可以从任何音频剪辑中生成语音的数字表示,并训练文本到语音模型以推广到新语音。 此应用程序可以在 5 秒内克隆任何声音并实时生成任意语音!
4.神经谈话2
NeuralTalk2 本质上是用 Lua 编写的图像捕获代码。 它在 GPU 上运行并且需要 Torch。 NeuralTalk2 可以利用多模态循环神经网络为图像/视频加上句子的字幕。 这是社交媒体内容创建者的理想工具——您可以为图像/视频生成字幕,也可以使用此模型创建有趣的图像/视频内容(带有有趣字幕的内容)。
阅读:机器学习职业
5. U-GAT-IT
U-GAT-IT(用于图像到图像转换的具有自适应层实例标准化的无监督生成注意力网络)是一个简单的机器学习项目——将人的图像转换为他们的动漫头像。 该模型可以通过利用一种新颖的无监督图像到图像转换技术来转换需要整体变化的图像和需要较大形状变化的图像。 不用说,这是动漫爱好者的完美项目!
6. 斯雷兹
Srez 使用深度学习来实现图像超分辨率——它可以将 16×16 的图像放大四倍,以生成 64×64 的照片。 结果描绘了与训练数据集相比似乎足够值得称道的清晰和杰出的特征。 底层架构包括一个 DCGAN,它接受生成器网络的 16×16 图像输入,而不是多项高斯分布。
7. 艾娃
AVA 是一个旨在提供人工智能驱动的自动化视觉分析的框架。 AVA 中的第一个“A”有多重含义——它是一个阿里巴巴框架,致力于成为“支持增强分析的自动化、人工智能驱动的解决方案”。 AVA包含三个包,分别是CKB(用于可视化/图表的经验知识的存储空间)、DataWizard(数据处理库)和ChartAdvisor(根据数据集和分析要求建议图表的核心组件)。
8.威震天
Megatron 由 NVIDIA 的应用深度学习研究团队开发,是一种功能强大的转换器,可以训练大量语言模型,以在扩展时提高其性能。 这是一个正在进行的项目,通过混合精度支持 BERT 和 GPT2 的模型并行、多节点训练。

谷歌开源机器学习项目
9.卡利班
Caliban 是一种工具,用于在隔离且可重现的 Docker 环境中开发 ML 研究工作流程和笔记本。 最好的部分——你甚至不需要学习 Docker 的复杂性来使用 Caliban! 使用 Caliban,您可以在您的机器上构建和运行 ML 模型,并将本地代码发送到云端。 该工具非常适合 Pytorch、Tensorflow 和 JAX 上的 ML 工作流。
10.不豆
Budou 是专为 CJK(中文、日文和韩文)语言设计的自动换行工具。 它会自动将 CJK 文本翻译成有组织的 HTML 代码,从而产生漂亮的排版。 Budou 根据浏览器的屏幕宽度将标题和句子分成多行有意义的块。
11. 因果影响
这个 Google 项目是一个统计库,用于估计干预对时间序列模型的因果影响。 CausalImpact R 包使用结构化贝叶斯时间序列来确定干预后响应指标如何演变(如果它最初没有发生)。 例如,回答“特定营销活动产生了多少新点击?”之类的问题非常具有挑战性。 不使用随机实验。 CausalImpact 可以帮助找到这些问题的答案。
12. DeepMind 实验室
DeepMind Lab 是一个完全可定制的第一人称 3D 游戏平台,用于人工智能和机器学习系统的研发。 它由许多具有挑战性的谜题和导航任务组成,这些任务在深度强化学习中至关重要。 DeepMind Lab 拥有简洁灵活的 API,可让您创建可快速迭代的创新任务设计和独特的 AI 设计。 Google 的 DeepMind 广泛使用 DeepMind Lab 来研究和训练 AI/ML 学习代理。
13. 深度变体
DeepVariant是一个分析管道,它利用神经网络从下一代 DNA 测序数据中寻找基因变异。 它使用Nucleus库(包含 Python 和 C++ 代码)以与 TensorFlow 无缝集成的常见基因组文件格式读取和写入数据。
14. 多巴胺
它是一个基于 TensorFlow 的研究框架,专为强化学习算法的快速原型设计而构建。 Dopamine 被设计成一个小而直观的代码库,使用户能够尝试激进的想法和投机性研究。 它有四个核心设计原则:
- 简单的实验
- 灵活发展
- 紧凑而可靠的实施
- 可重复的结果
15. 金翅雀
Goldfinch 是为解决细粒度识别挑战而创建的数据集。 它包括不同类别的集合——鸟、蝴蝶、狗、飞机和其他类别,以及相关的 Flickr 搜索 URL 和 Google 图片搜索。 狗类别包括许多主动学习注释。 Google 使用 Goldfinch 探索计算机视觉和机器学习技术以解决细粒度识别问题。

16. 库比流
Kubeflow 是专为 Kubernetes 设计的 ML 工具包。 它使在 Kubernetes 上部署机器学习 (ML) 工作流具有可移植性和可扩展性。 主要目的是提供一种简单的方法,将一流的机器学习操作系统部署到多种不同的基础设施。 您可以在任何运行 Kubernetes 的系统或环境上运行 Kubeflow。
17.洋红色
这是一个研究项目,旨在探索机器学习如何创造音乐和艺术。 该项目的主要重点是构建深度学习和强化学习算法来制作歌曲、图像、绘画和其他创意内容。 它试图创造智能工具,以增强艺术家和音乐家的能力和潜力。
结论
最后,我们的最后一条建议是通过这些项目并分解它们以了解更深层次的细微差别。 这将有助于丰富您的 ML 知识,并教您 ML 技术在每个项目中的工作方式有何不同。
我们希望通过深入研究这 17 个开源机器学习项目,您会找到开发自己的机器学习项目的灵感!
如果您有兴趣了解有关机器学习的更多信息,请查看 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭,该文凭专为工作专业人士设计,提供 450 多个小时的严格培训、30 多个案例研究和作业、IIIT- B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。
在医疗保健中使用 AI 时会出现哪些问题?
医学领域需要透明度和描述临床决策的能力。 在医疗保健领域使用深度学习和其他 AI 模型非常有益,但解释模型是一项艰巨的任务。 AI 临床应用还面临某些伦理考虑,例如用于 AI 模型训练的数据的隐私问题以及在医疗领域实施 AI 时的安全问题。
人工智能如何在时间和金钱方面降低医疗保健成本?
医学领域的人工智能算法比传统方法便宜。 由于在医疗保健系统中使用了人工智能技术,人们不再需要进行大量昂贵的实验室测试。 这可以从人工智能在识别能够检测人体某些疾病的生物标志物方面的潜力中看出。 这些算法确保指定这些生物标志物的大部分手工劳动可以自动化。 通过这种方式,他们可以节省时间,这在该领域非常重要。
使用人工智能如何赋予患者权力?
可穿戴技术,如智能手表,已经被全世界大量的人用来捕捉从睡眠模式到心率的日常健康数据。 当这些数据与机器学习相结合时,有可能在风险变得严重或无法治疗之前很久就成功地告知个人他们是否有患某些疾病的风险。 目前,移动应用程序提供了细粒度的患者资料信息,这可以帮助患有某些慢性病的患者更好地管理他们的疾病,从而过上更健康的生活。 通过这种方法,人工智能有可能使我们能够为自己做出更好的健康决策。