行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 数据挖掘 正文

MMLSpark:微软开源的用于Spark的深度学习库

MMLSpark为Apache Spark提供了大量深度学习数据科学工具,包括将Spark Machine Learning管道与Microsoft Cognitive Toolkit(CNTK)和OpenCV进行无缝集成,使您能够快速创建功能强大,高度可扩展的大型图像和文本数据集分析预测模型。

MMLSpark需要Scala 2.11,Spark 2.1+,以及Python 2.7或Python 3.5+。

显着特点

从 HDFS 轻松摄取图像到Spark DataFrame(示例:301)

使用 OpenCV 进行转换的预处理图像数据(示例:302)

使用 CNTK 进行预训练的深层神经网络(示例:301)

使用来自 Keras 预先训练的双向LSTM进行医疗实体提取(示例:304)

在Azure上的N系列GPU虚拟机上训练基于DNN的图像分类模型

通过单个变换器在SparkML中的基元上方使用方便的API实现自由格式的文本数据(示例:201)

列车分类和回归模型容易通过数据的隐式特征化(示例:101)

计算一组丰富的评估指标,包括每个实例的指标(示例:102)

所有的示例可以参见:https://github.com/Azure/mmlspark/tree/master/notebooks/samples

一个简单的示例

以下是使用预先训练的CNN在CIFAR-10数据集中分类图像的简单示例的摘录。完整的代码参见:https://github.com/Azure/mmlspark/blob/master/notebooks/samples/301%20-%20CIFAR10%20CNTK%20CNN%20Evaluation.ipynb

 

 

安装

Docker

使用MMLSpark 的最简单方法是通过预先编译好的Docker container,为了使用它,你先要运行下面的命令:

docker run -it -p 8888:8888 -e ACCEPT_EULA=yes microsoft/mmlspark

然后通过浏览器访问http://localhost:8888,这里我们可以运行简单的示例代码,更详细的使用请参见官方文档:https://github.com/Azure/mmlspark/blob/master/docs/docker.md

Spark package

当然,除了在Docker container里面使用MMLSpark 之外,我们还可以直接通过--packages 选项直接在现有的Spark集群中使用MMLSpark,具体如下:

 

 

更多关于MMLSpark的使用和介绍,请参见官方文档。

微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
最新文章
SEM推广服务
热门文章
热点图文

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部