假设数据是:A到Z的26个单词。
我们假定这样的组合
A+B+E=开心的故事
B+E+F+Z=恐怖的故事
M+L=伤心的故事……
而人在做洞察的时候,是尽可能从A到Z中想象故事,或是用之前的经验来套出一个故事。
而洞察往往是惊喜的,WOW的那一种,就是说出来后你会觉得还可以这样啊,原来这也可以我怎么没想到的那种……
如果我们洞察是这样的情况(假设这是一种洞察),现在调整一下方式,用算法来跑。
即:
用算法跑A和Z,让算法把A和Z之间建立联接,也就是让算法“讲故事”(这样好理解)
然后A到Z总可以跑出很多的“故事”,开始穷举,并列出无数个可能的“故事”。
然后去掉一些“故事”,把那些没有出现过的,权重低的,特别有意思的,原来还可以这样的……“故事”提出来。
这样就可以减少到一定的数量的“故事”。
这样的故事,或许就是真正接近洞察的故事。
也就是说:
用算法统计现有数据的关键词,把他们编成一个一个的故事。
把这些故事和数据对比,之前出现过的,权重降低。
之前没有出现过的故事,权重加高。
这样就可以得到洞察了。
举例:
数据:我,苹果,吃,校长,开车,送。
正常的人观察:校长开车送我吃苹果。
算法来做洞察:我开苹果车送校长吃。