想了一下午,灭了两个创业idea

关于创业,确实需要大把大把的时间用来思考,一个下午我就在不断的思考之前的几个idea的合理性,这种大段的思考可以帮助自己避免因为冲动而冲进某个人潮拥挤的赛道里,也会帮助自己尽早地识别天花板比较低或者空间比较小的行业。

着重思考的两个idea分别是:一个二手的券码交易平台,一个是面向AI时代的数据标注平台。这两个idea是我一个都比较看好的,而且是真的有需求,前者是我自己经常逛街吃吃喝喝的时候想要是有券码可以多少来点折扣就好了;后者是想着有没有一些平台可以让妈妈们在家带孩子的时候也能补贴家用。理想是比较好的,但深入思考会发现不太是那么回事儿。

1. 二手券码交易平台

这个idea其实相对比较清晰,而且切中了人人都想要优惠这个点,基本idea是从各个渠道搜罗来一些优惠券码,比如淘宝或者信用卡闲置权益,然后再在一个集中的地方卖出,赚取这个过程中的差价,如果能实现,那么从第一天起就能够盈利,类似于二手书平台多抓鱼的逻辑。

但想一想这个思路最大的坑在于:这种套取利差的行为里并未提供价值,因此纯属于一种套利行为,这种套利行为会因为商家感受到吃亏而停止券码的发放或者过多同行的加入导致利差消失,将商业模式建立在这个基础上是非常不稳固的。

同时,研究下市场,会发现已经有手快的人做出来了,还不止一个:『券码无忧』『茶蛋有券』『收券吧』,都已经基本实现从信用卡权益收券,再在平台上售卖的功能,基本体验已经完全够用。

因此,这个idea如果作为个人练手的项目是可以尝试的(意思就是别抱着赚大钱的想法),但作为一个创业项目天花板太低了点。

2. 人工智能数据标注平台

这个idea其实从2013年就一直萦绕在我脑海里,那时候人工智能还鲜有人说,主要启发源泉是实习的公司使用亚马逊的MTurk作为众包数据标注工具,其标注主力是美国的一些家庭主妇,因此就想到copy这个平台可以释放一些赋闲在家的妈妈们的劳动力。但深入研究后发现我想得还是太少了。

首先就说说亚马逊的MTurk平台吧,在这个平台刚开始的时候确实是个新事物,不需要专门养数据标注的人力,只需要花很少的一点钱,就可以很快地拿到回收的数据了,这在机器学习早期确实是个获取信息性价比极高的方式。而当AI兴起之后,人们对AI解决问题的复杂度预期上升了,如今需要众包标注的已经不是简单的分词或者句意的理解,而变成了音频、图片、视频等的复杂标注任务。众包方式在遇到复杂任务时的准确率问题就变得尤其突出,特别是还需要再花费大量人力来筛选、处理这些数据,让很多公司得不偿失。

如今的主流数据标注方式变成了团队或者标注工厂模式,即专门养一批标注人力来应对层出不穷的标注任务,但是这种工业化的方式会带来成本的增加 —— 不仅需要养人还有机器支出、场地支出、管理费用支出 —— 这些在众包的情况下都是不需要的,团队的组建者如果还需要再留存一些利润的话,真正能到标注者手中的工资会变得极少(大约五六千的样子)。因此这种方式就是一个典型的劳动密集型的工作方式,凡事劳动密集型的工作方式都免不了有着激烈而残酷的竞争。

更难受的是这些标注如果是为了有监督学习的算法还好一些,因为为了提高模型的精度会有源源不断的任务出来,但如果是为了迭代到无监督算法模型,那么其实这些标注人员将会被自己辛苦标注出来的数据建立的模型给消灭。这一点也许没那么快到来,但终将会到来,如果一个行业始终笼罩着这个阴影,那其上升空间总是有限。

在眼下,做这个行业也不是没法做,目前国内的市场规模大概在50亿人民币左右,预计五年内应该至少还要翻一番吧。最终能活下来的公司很可能会是:注重质量、管理费用支出较少、自建可重复售卖数据的平台,事实上现在已经有了,他叫Appen,2018年营收3.6亿美金,拥有100万名众包人员。

综上,这个赛道到最后就是拼对劳动密集型的管理、对数据的重复销售能力,而且还笼罩在AI这个不知道是涨还是退的趋势里,所以终究不是一个理想的赛道,某种意义上还不如第一个,它还会面临收支平衡的问题。

下一步怎么办呢?

一下午灭了两个idea,而且是脑海中驻留已久的idea在有点沮丧的同时也有一点轻松 —— 意味着我可以清空他们同时装入其他的idea了,但装什么我还是茫然的,我需要给自己记个todo:

  • 哪里有能够了解最新创新idea的渠道呢?
  • 哪里有能够了解到当前最优想法的一批人在捣鼓什么呢?