第758章 流形学习(2 / 2)
90年代这会,方便面还属于非常流行的即食类食品。
常浩南读本科那阵子,大家的条件普遍比较差,有闲钱吃得起的人不多。
但到了99年这会,大学生在宿舍备上几袋甚至一箱,都不算什么稀罕事了。
“你们说……”
常浩南突然开口道:
“生产方便面的企业,是怎么保证不漏装或者多装调料包的?”
正在低头吃饭的姚梦娜一愣,旋即意识到常浩南这还是在思考刚才她提出来的问题。
给方便面里面塞调料包和给飞机打铆钉,在数学模型上其实是差不多的。
而生产方便面的企业,显然不太可能有多么高大上的设备和技术。
“大概……称重?”
姚梦娜猜测道:
“调料包大概占整包方便面重量的10%左右,如果少放或者多放,那应该很容易检测出来。”
“嗯……但面饼重量本身就有误差,而且调料包有好几种,称重只能证明总量没问题,但不能保证没放错……”
常浩南摇摇头否定道。
旁边的朱雅丹左看看常浩南,右看看姚梦娜,实在是不知道这两个人为什么突然讨论起这个问题了。
“那个……”
虽然她觉得在两位博士面前有点班门弄斧,但最后还是没忍住:
“在封装步骤之前,专门找个人在流水线旁边看着不就行了么?”
姚梦娜单手扶额:
“我们就是在想,如何才能不用这个人,但实现一样的效果。”
“这个么……”
朱雅丹瞬间缩了缩头:
“我只是随便一说……但有些时候人脑的作用或许还是没办法代替的……”
餐桌周围又恢复了平静,只剩下偶尔发出的微弱咀嚼声。
但常浩南仍然没有动筷子。
“你说得对。”
几分钟之后,当朱雅丹都快要吃完面前盘子里的炒面时,常浩南突然开口道:
“人类的大脑能够通过某种办法解析高维数据,从而获取对外部世界的感知。”
“?”
朱雅丹满脑袋问号地抬起头,但看着常浩南思考的样子,很有自知之明地没有打扰。
“换句话说,具有高维数的外部信息必定潜在于一个低维空间中的非线性流形结构上……”
在近70年前,美国统计学家哈罗德·霍特林就已经提出过将高维数据进行降维的主成分分析法。
他认为方差越大提供的信息越多反之提供的信息越少,于是通过原分量的线性组合构造方差大、含信息量多的若干主分量,再进行矩阵奇异值分解,实现数据维数的降低。
但主成分分析法只相当于找到投影距离最小的意义下的最佳线性映射,而现实中却没有那么多简单的线性问题。
不过,这个思路却是可以被借鉴的。
常浩南放下只吃了一口的羊汤面,蹭地站起身,快步离开食堂。
身负安保职责的朱雅丹赶紧跟上。
姚梦娜的反应稍微慢了一点,刚想起身,又意识到还没结账,只好掏出钱包,无奈地走向收银台。
回到办公室的常浩南重新找到了刚才那张纸。
在三个基本条件下方又写下了几行字。
给定一组高维数据X={x1,x2,…,xn}RD,n为数据样本个数,D为高维数据的维数。
再假设中的数据样本来自于或近似来自于低维嵌入空间中的数据Y={y1,y2,…,yn}Rd。
寻找一个从高维观测空间到低维嵌入空间的映射关系,使得yi=xi,以及一个一对一的重构映射关系^1,使得xi=^1yi。
写到这里,常浩南的脸上露出了一个满意的微笑。
尽管仍然没有给出完整的思路,但是,他至少已经把三个抽象的基本条件解析成为了一个具体的数学问题。
而对于理论研究来说,明确地提出问题,几乎也就相当于走完了成功之路的一半。
想到这里,他回到这张纸的最上面,重新写下六个字。
流形学习方法。