热门资讯> 正文
2025-10-21 15:20
日前,DeepSeek-AI团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法,引爆网络讨论。
AI大神Andrej Karpathy在社交平台“X”上发文表示,非常喜欢DeepSeek OCR论文。Karpathy称,我相当喜欢新的 DeepSeek-OCR 论文。它是一个很好的 OCR 模型(可能比 dots 稍微差一点),而且数据收集等等也不错,但无论如何,这都不重要。对我来说(尤其是作为一个以计算机视觉为核心,暂时伪装成自然语言的人),更有趣的部分是,像素是否比文本更适合作为LLM的输入?文本标记在输入端是否浪费资源,甚至很糟糕。
讨论的最后,马斯克(Elon Musk )也现身评论区,并给出了一个更具未来感的判断:从长远来看,AI模型超过99%的输入和输出都将是光子。没有其他任何东西可以规模化。
此前,刚“尖锐”评价过AI现状的卡帕西也表示,我很喜欢……特别是图像比文字更适合LLM输入,妙啊。还有网友直呼这是“AI 的 JPEG 时刻”,AI 记忆架构打开了新路径。
DeepSeek最新开源的模型被夸爆的同时,据同花顺数据,10月21日,AI人工智能ETF(512930)涨超4%,最新价超2.10元。中证人工智能主题指数(930713)前五大权重股均涨超6%。