们那个时候是真没你们现在的条件,什么都靠自己摸索,不过话又说回来,小李报告上说豆豆数据库用了一种新的压缩算法,具体是怎么个情况?能不能详细说说?”马旭明主动开口道。
虽然说对于乔泽的评价心里多少有点不舒服,但说实话,也没太多着恼的情绪。
主动问出来,还真没什么挑衅的意思,主要是他对新的压缩算法是真的很感兴趣。外行看热闹,内行看门道。
研究过豆豆之后,马旭明也真觉得豆豆管理数据库的超高能力,跟一些新算法息息相关。
听了这话,乔泽问道:“你来之前了解过超螺旋代数中关于超复数跟超二项式这些形式的具体描述吗?”
“只是超复数形式还真难不住我们,小乔啊,我跟你讲,这次我们都是有备而来,专门研究过你的乔代数几何。”一边的张明睿生怕乔泽误会了马明旭的态度,在旁边插了一句。
“哦。”乔泽点了点头,然后看了身边的苏沐橙一眼,女人立刻进屋给乔泽拿了一叠稿纸出来。
“那我给你举个例子,你应该就明白了,先假设一个高维向量,mathbf{x}=x_1,x_2,ldots,x_n,其中x_i就是数据的第i个特征。
然后将每个特征表示为超螺旋代数中的超复数形式x_i=a_i+b_iepsilon,这里的epsilon是超越单位。
现在假设我们通过pca获得了一组特征向量{mathbf{v}_1,mathbf{v}_2,ldots,mathbf{v}_k},这是数据的主要变化方向。
接下来就能将数据投影到pca提取的主要特征向量上,并保留前k个主要成分,以减少数据的维度。
压缩后的数据可以表示为mathbf{y}=mathbf{y}_1,mathbf{y}_2,ldots,mathbf{y}_k,其中mathbf{y}_i=mathbf{x}athbf{
-->>(第3/7页)(本章未完,请点击下一页继续阅读)