怎么自己在家创业

核心提示关于产品、数据和人,这里有 8 条经验。这是一篇经验帖,作者 Daniel Shenfeld 曾在 12 家创业公司工作过,这些公司覆盖金融科技、医疗、教育技术、生物技术等多个领域,所处的阶段也各有不同,从种子前到收购后都有。Daniel

以下是关于产品、数据和人的8点经验。

这是一个体验贴。作者丹尼尔·申菲尔德(Daniel Shenfeld)曾在12家创业公司工作过,这些公司涵盖金融科技、医疗、教育科技、生物科技等领域,处于不同的阶段,从前期种子到收购后。丹尼尔在不同的公司担任过不同的职位,从基层员工到数据科学总监和战略顾问总监。在他的所有工作中,他一直致力于有趣的机器学习和数据科学问题的研究。每个人都试图创造伟大的产品,有些人确实成功了。

他从这么多的工作经历中学到了什么?本文介绍了他在产品、数据、人才方面的八点经验。

专注于产品,而不是人工智能

作为一个地地道道的数学家,我一开始对机器学习科学印象深刻,想创造新的算法和方法来解决挑战。

但我很快意识到,即使是最精确的机器学习模型,也不能自己创造价值。机器学习和人工智能的价值是通过它们支持的产品来衡量的。弄清楚如何有效地做到这一点,才是构建ML驱动产品的真正意义。

《爱丽丝梦游仙境》的作者刘易斯·卡罗尔也是一名数学家。他发明了许多吸引人的产品,尽管有些并不像预期的那样起作用。)

关注问题,而不是方法

如果目标是打造一个产品,那么机器学习和AI只是实现目标的手段。重要的是如何解决产品问题,而不是用什么方法。在大多数情况下,快速但有缺陷的方法会让你走得更远。如果一个问题通过简单的回归就能很好的解决,那就不要训练深度神经网络了。

当你专注于问题本身时,你有时会发现机器学习并不是解决问题的最佳工具。很多问题都是流程问题。即使在这些情况下,数据科学家也可以做出很多贡献,因为他们自然倾向于采取严格的、数据驱动的方法。但这并不意味着用人工智能修复糟糕的流程是个好主意。只需修复流程。

寻找数据和产品之间的协同作用

将现有产品与基于机器学习模型的预测结果结合起来,很少能体现机器学习的真正价值。当然这也会给他们加分一点,但是在强大的AI产品中,机器学习不仅仅是一个附加功能。它是创造价值的引擎,产品基于引擎:产品和数据必须协同工作。

做得好的话,就会形成一个强大的良性循环,我称之为“产品/数据拟合”:产品有效实现了数据的潜在价值,同时不断产生必要的数据,进一步完善产品。

将机器学习引入产品是一种次优策略。

特别是AI不能只停留在数据科学和工程团队。组织的其他部分,从产品到管理,都应该参与进来,以加快创造价值的过程。这需要很大的教育和投入,超出了过去工程师构建软件的习惯。

数据第一,AI最后

机器学习和AI都需要大量的数据,更重要的是“高质量的数据”。如果你想从头开始构建一个产品,你应该考虑从第一天开始收集数据。如果想在现有产品中引入AI技术,在进入AI部分之前,首先要做好在数据工程和重构架构上大量投入的准备。

这并不意味着你必须在实现价值之前预加载所有的工作。更好的数据操作意味着更好的分析,这对任何组织的学习和改进都是至关重要的。使用这些成就来展示价值并产生组织认同。当你的分析非常扎实的时候,你才能真正开始思考机器学习。

有效沟通。

创造优秀的产品,需要优秀的产品经理和高管的支持。虽然AI和深度学习的力量吸引了很多人,但很少有非技术人员真正了解这些技术。讨论有效的机器学习和AI需要对统计学有深刻的理解,交流的隔阂往往会导致不切实际的期望。

关于机器学习和AI的讨论,显然不完全是基于商业指标。

一个重点是在讨论业务指标的同时,要考虑如何将业务指标转化为模型指标。这样的话,产品经理会有很多责任,但对于数据科学家来说也是如此。他们必须了解所提产品相关领域的知识,对业务有深入的了解,这样才能真正高效地工作。

但是快速和有缺陷的方法的副作用并没有那么大。

正如我前面提到的,快速但有缺陷的方法会让你走得更远。一部分原因是,现在快速但有缺陷的方法实际上是过去缓慢但准确的方法。像word2vec这样的工具已经变得像回归一样容易使用,研究人员也在不断创造强大的新工具。任何数据科学家都有必要充分理解不同的构建模块以及它们之间的粘合剂。

开源工具爆炸式增长的后果之一是,开发一个专门的ML平台在大多数情况下并不是一个好主意。当然,你应该使用由普通积木建立的专门算法,并在你自己的问题和领域中使用这些算法。但是,请把深度学习的研究留给谷歌的研究人员——专注于商业问题,记得吗?

如有疑问,出示数据。

向用户展示数据是有用的,但并不是所有的展示方法都同样有效。

在产品开发的早期,最重要的活动是获得市场反馈。但是机器学习需要大量的数据,需要很长的时间。这就提出了一个问题:如何在没有太多数据的情况下,获得一个数据产品的市场反馈?

一般来说,最好的解决方案是向用户展示数据。人类一次只能处理少量的数据,所以数据不太多也没关系。用户会用你给他们看的数据做什么?他们想隐藏什么,想深挖什么?披露以前不可用的信息是一种强大的方法,可以提供数据的潜在商业价值。

建立信任

信任是大多数技术成功的主要因素。每一项技术最终都是为人所用的,所以必须取信于人。在机器学习应用的背景下,有些人可能会担心他们的工作会被自动化取代。其他人正在根据技术提供的信息做出重要决策。

如果这些顾虑混杂在一个AI产品中,比如一个产品试图替人类做决定,而不是让人类自己做决定,就会导致信任的迅速丧失。

信任易失难得。创造人们信任的产品。

柴郡猫展示了一种获得用户信任的方法。

原文链接:https://towards data science . com/what-ive-learned-working-with-12-machine-learning-startups-a9a 3026d 2419

本文为机器之心整理,授权请联系本微信官方账号。

 
友情链接
鄂ICP备19019357号-22