文章插图
4.用于计算机视觉,NLP和音频的开源机器学习工具“如果我们想要机器思考,我们需要教他们看 。”——Fei-Fei Li博士的计算机视觉 。
- SimpleCV:如果你从事任何计算机视觉项目,必须使用OpenCV 。但你有遇到过SimpleCV吗?SimpleCV可以访问几个高性能的计算机视觉库,如OpenCV——无需首先了解位深度、文件格式、色彩空间、缓冲区管理、特征值或矩阵与位图存储,这使计算机视觉变得简单 。
文章插图
- Tesseract OCR:你是否使用过创意应用程序,通过使用智能手机的相机扫描文档或购物账单,或者仅仅通过给支票拍照就可以把钱存入银行账户?所有这些应用程序都称之为OCR或光学字符识别软件 。Tesseract就是这样一种OCR引擎,能够识别100多种语言,也可以训练识别其他语言 。
- Detectron:Detectron是Facebook AI Research的软件系统,它实现了最先进的物体检测算法,包括Mask R-CNN 。它是用Python编写的,由Caffe2深度学习框架提供支持 。
文章插图
- StanfordNLP:StanfordNLP是一个Python自然语言分析包,关于这个库的最好的部分就是它支持超过70种人类语言!
文章插图
- BERT即服务:你们所有的NLP爱好者都会听说过BERT这一来自谷歌的突破性NLP架构,但你可能还没有遇到过这个非常有用的项目 。Bert-as-a-service使用BERT作为句子编码器,并通过ZeroMQ将其作为服务托管,允许你仅用两行代码将句子映射到固定长度的表示形式 。
- Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容 。
- LibROSA:LibROSA是一个用于音乐和音频分析的Python包 。它提供了创建音乐信息检索系统所需的构建块 。当我们使用深度学习等语音到文本的应用程序时,它在音频信号预处理中被大量使用 。
当谈到机器学习时,RL是最近的热门话题 。强化学习(RL)的目标是培养能够与环境互动并解决复杂任务的智能代理,实现机器人、自动驾驶汽车等领域的实际应用 。以下是一些对RL最有用的培训环境:
- 谷歌研究足球:谷歌研究足球环境是一个新颖的RL环境,代理商的目标是掌握世界上最受欢迎的运动——足球 。这种环境为你提供了大量的控制来训练RL代理 。
- OpenAI Gym:Gym是一个用于开发和比较强化学习算法的工具包 。它支持教学代理从步行到玩乒乓球或弹球戏等游戏 。在下面的gif图片中,你可以看到一个正在学习走路的机器人 。
文章插图
- Unity ML代理:Unity机器学习代理工具包(ML-Agents)是一个开放源码Unity插件,可以将游戏和模拟作为培训智能代理的环境 。通过一个简单易用的Python API,可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练agent 。
文章插图
- Malmo项目:Malmo平台是一个基于Minecraft构建的复杂AI实验平台,旨在支持人工智能的基础研究,由Microsoft开发 。
正如上面的一组工具可以明显看出,当我们考虑数据科学和人工智能相关的项目时,开源是一条正确的道路 。我可能只是触及了冰山一角,但是有许多工具可用于各种任务,使你作为数据科学家的生活更轻松,你只需要知道在哪里查找即可 。
你认为哪些工具应该列在这个清单上?在下面写下你的最爱,以便社区了解!
原文:https://medium.com/analytics-vidhya/21-must-know-open-source-tools-for-machine-learning-you-probably-arent-using-but-should-f605b94d9b06
本文为 CSDN 翻译,转载请注明来源出处 。
【END】
推荐阅读
- 5 个用于在 Linux 终端中查找域名 IP 地址的命令
- 快速理解色彩搭配的三个配色知识
- 分析:网络中的各种互通与不通
- 什么是MVC开发,及MVC开发规则
- 只要输入网址,就知道网站所有信息
- 首个厦门产区生产的茶品莲花高山茶即将诞生
- 虚拟主机和云服务器哪个对网站seo优化有利
- 登入月亮的有哪些国家 离月亮最近的国家是哪个
- 梦见弟媳妇生了个男孩我抱着呢 梦见弟媳妇生了个男孩会说话
- 惊蛰你吃梨了吗?如果不知道这4个讲究 吃了也是白搭