做机器学习项目的 checklist
这个 checklist 能帮助你迈出做一个成功的机器学习项目第一步。
避免混淆,用这个简单的清单来计划你的 AI 项目。
对许多人来说,机器学习仍然是一项新技术,这可能会让它难以管理。
项目经理通常不知道如何与数据科学家谈论他们的想法。
在我们规划 30 多个机器学习项目的经验中,我们提炼出了一个简单有效的 checklist。
1. 项目动机
明确你的项目的更广泛的意义。
-
你要解决的问题是什么?What is the problem you want to solve?
-
相关联的目标策略是什么?
如果项目团队不理解你的动机,那么他们就很难提出好的建议。
有很多方法可以解决机器学习的问题。所以帮助你的团队以你最感兴趣的方式工作 —— 退一步告诉他们为什么这个项目是重要的。
2. 问题定义
- 你想要预测的具体输出是什么?
对于给定的输入,你的机器学习模型将理想地学会预测非常具体的输出。
所以这里你要尽可能的清楚。“预测机器故障”可能意味着很多事情 —— “告诉我,在未来 24 小时内,意外停机的风险何时增加 50% 以上”更好。
- 你的算法有什么输入数据?
模型预测输出的唯一方法是从模型的输入因子中派生出来。所以,为了有机会做出好的预测,你必须有与输出相关的数据。数据越多越好。
- 什么是预测你的具体输出的最相关因素?
算法不能理解我们的世界。重要的是,你要给数据科学家一些提示,告诉他哪些数据实际上是相关的,这样他就可以用算法能够理解的方式选择和分割数据。
- 你能提供多少训练样本 ?
一个算法需要的练习比一个人要多得多。你最少需要 200 个样本。越多越好。
3. 性能度量
你怎么知道什么是好的结果?
- 你有一个简单的基准测试来比较你的结果吗?
有没有一种简单的方法来利用你已有的数据进行预测?也许你可以根据去年的数字预测销售额,或者通过计算客户上一次登录后的天数来评估客户离开的风险。一个简单的基准测试可以为你的团队提供有价值的问题洞察力。它给你一些东西来衡量模型。
- 本文地址:http://www.6aiq.com/article/1578982092488
- 本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出
- 知乎专栏 点击关注
-
你将如何衡量预测的准确性 ?
-
你期望的最低准确度是多少?
你希望预测的准确率平均在 5% 以内,还是更重要的是预测误差不超过 10%?你的模型可以以任何一种方式进行调优。哪种方式更好取决于什么对你来说是重要的。
- 一个完美的解决方案是什么样的?
即使这对你来说是显而易见的,把它写在纸上也能帮助你理清思路。
- 是否有参考解决方案(如研究论文)?
如果有人以前解决过类似的问题,就把他们的解决方案当作灵感。这为每个人提供了一个共同的起点,这样他们就可以看到要使用哪些数据,可能会出现哪些问题,以及要尝试哪些算法。
4. 时间线
一个性能验证项目的时间线示例。
-
是否有截止日期需要注意?
-
你什么时候需要看到第一个结果?
-
你想什么时候有一个完整的解决方案?
人工智能解决方案可以无限地改进。明确的最后期限有助于让团队集中精力。
5. 联系人
-
谁负责项目 (PM)?
-
谁可以授权访问数据集?
-
谁能帮助理解当前的流程和 / 或简单的基准测试 (领域专家)?
在一个项目的过程中会出现许多问题。明确你的工程师可以向谁求助。
6. 合作
- 在业务和工程团队之间建立一个双 / 周的更新。
每周安排一次会议来查看当前的结果,并讨论那些不需要通过电子邮件来回答的问题。
-
应该涉及谁 ?
-
他们应该学什么?
在学习如何管理人工智能方面,没有什么比实际项目的实践经验更有价值。如果你想让你的团队的其他成员学习,从一开始就要说清楚。
- 定义代码和问题的位置以及如何访问代码。
让所有的开发从一开始就透明。这样任何人都可以很容易地加入,给出提示,并检查进展。
回答这个清单上的问题,并与大家分享
世界仍在研究如何最好地运行人工智能 / 机器学习项目。填写这份清单将会给你所有成功的机器学习项目的要素之一:理解。
原文:
英文原文:https://www.datarevenue.com/en-blog/machine-learning-project-checklist
时间:2020-01-19 00:00 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
- [机器学习]Facebook新AI模型SEER实现自监督学习,LeCun大赞最有
- [机器学习]一文详解深度学习最常用的 10 个激活函数
- [机器学习]增量学习(Incremental Learning)小综述
- [机器学习]盘点近期大热对比学习模型:MoCo/SimCLR/BYOL/SimSi
- [机器学习]深度学习中的3个秘密:集成、知识蒸馏和蒸馏
- [机器学习]堪比当年的LSTM,Transformer引燃机器学习圈:它是
- [机器学习]深度学习三大谜团:集成、知识蒸馏和自蒸馏
- [机器学习]论机器学习领域的内卷:不读PhD,我配不配找工
- [机器学习]Facebook新AI模型SEER实现自监督学习,LeCun大赞最有
- [机器学习]一文详解深度学习最常用的 10 个激活函数
相关推荐:
网友评论: