21 个必须知道的机器学习开源工具( 二 )



21 个必须知道的机器学习开源工具

文章插图

4.用于计算机视觉,NLP和音频的开源机器学习工具“如果我们想要机器思考,我们需要教他们看 。”——Fei-Fei Li博士的计算机视觉 。
  • SimpleCV:如果你从事任何计算机视觉项目,必须使用OpenCV 。但你有遇到过SimpleCV吗?SimpleCV可以访问几个高性能的计算机视觉库,如OpenCV——无需首先了解位深度、文件格式、色彩空间、缓冲区管理、特征值或矩阵与位图存储,这使计算机视觉变得简单 。

21 个必须知道的机器学习开源工具

文章插图
  • Tesseract OCR:你是否使用过创意应用程序,通过使用智能手机的相机扫描文档或购物账单,或者仅仅通过给支票拍照就可以把钱存入银行账户?所有这些应用程序都称之为OCR或光学字符识别软件 。Tesseract就是这样一种OCR引擎,能够识别100多种语言,也可以训练识别其他语言 。
  • Detectron:Detectron是Facebook AI Research的软件系统,它实现了最先进的物体检测算法,包括Mask R-CNN 。它是用Python编写的,由Caffe2深度学习框架提供支持 。

21 个必须知道的机器学习开源工具

文章插图
  • StanfordNLP:StanfordNLP是一个Python自然语言分析包,关于这个库的最好的部分就是它支持超过70种人类语言!

21 个必须知道的机器学习开源工具

文章插图
  • BERT即服务:你们所有的NLP爱好者都会听说过BERT这一来自谷歌的突破性NLP架构,但你可能还没有遇到过这个非常有用的项目 。Bert-as-a-service使用BERT作为句子编码器,并通过ZeroMQ将其作为服务托管,允许你仅用两行代码将句子映射到固定长度的表示形式 。
  • Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容 。
  • LibROSA:LibROSA是一个用于音乐和音频分析的Python包 。它提供了创建音乐信息检索系统所需的构建块 。当我们使用深度学习等语音到文本的应用程序时,它在音频信号预处理中被大量使用 。

  •  
5.用于强化学习的开源工具
当谈到机器学习时,RL是最近的热门话题 。强化学习(RL)的目标是培养能够与环境互动并解决复杂任务的智能代理,实现机器人、自动驾驶汽车等领域的实际应用 。以下是一些对RL最有用的培训环境:
  • 谷歌研究足球:谷歌研究足球环境是一个新颖的RL环境,代理商的目标是掌握世界上最受欢迎的运动——足球 。这种环境为你提供了大量的控制来训练RL代理 。
  • OpenAI Gym:Gym是一个用于开发和比较强化学习算法的工具包 。它支持教学代理从步行到玩乒乓球或弹球戏等游戏 。在下面的gif图片中,你可以看到一个正在学习走路的机器人 。

21 个必须知道的机器学习开源工具

文章插图
  • Unity ML代理:Unity机器学习代理工具包(ML-Agents)是一个开放源码Unity插件,可以将游戏和模拟作为培训智能代理的环境 。通过一个简单易用的Python API,可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练agent 。

21 个必须知道的机器学习开源工具

文章插图
  • Malmo项目:Malmo平台是一个基于Minecraft构建的复杂AI实验平台,旨在支持人工智能的基础研究,由Microsoft开发 。
6.最后指出
正如上面的一组工具可以明显看出,当我们考虑数据科学和人工智能相关的项目时,开源是一条正确的道路 。我可能只是触及了冰山一角,但是有许多工具可用于各种任务,使你作为数据科学家的生活更轻松,你只需要知道在哪里查找即可 。
你认为哪些工具应该列在这个清单上?在下面写下你的最爱,以便社区了解!
原文:https://medium.com/analytics-vidhya/21-must-know-open-source-tools-for-machine-learning-you-probably-arent-using-but-should-f605b94d9b06
本文为 CSDN 翻译,转载请注明来源出处 。
【END】




推荐阅读