热门资讯> 正文
2025-11-21 15:12
11月21日,东方证券发布传媒行业动态跟踪研报,指出Nano banana2发布,开启推理式视觉生成的技术跃迁。
Nanobanana2正式发布,认为核心突破在于引入类LLM思考链路,先理解语义与逻辑,再执行像素生成,从扩散式生成跃迁到推理驱动的视觉智能生成,更接近具备图像生成能力的推理引擎,重构未来图像模型范式。
Nano2的突破性进步在于:
(1)世界理解能力【基于世界知识储备的推理式生成能力】:用户输入提示词后,模型会自主搜索知识,如物理规律、文献资料等。部分实例测试Nano2在数学解题、产品线路图生成、时间信息理解、经纬度信息还原场景等表现出色(见正文图)。东方证券判断可能系,架构中搭载Gemini3pro的推理模块,且内置生成前自行纠错的循环机制,可进行SearchGrounding帮助生成准确性,充分发挥先进Google全模态模型优势,及搜索语料库的知识积淀。
(2)文字渲染大幅改善,中文能力提升,语义响应更精准:Nano2文本渲染能力全面突破,幻觉生成概率显著降低,透明、阴影、艺术字体等渲染精度提升,且中文能力极大优化,对于画面局部调整语义理解更为精准。
(3)画质清晰度提升至2K和4K级别,更能响应专业级产出,如UI原型快速生成、产品渲染、商业摄影、概念设计等。
底模能力为应用(用增)第一生产力,Gemini 3 Pro上线及NanoBanana 2集成,看好Gemini APP、及Google AI系列用增进一步上行。