
想象一下,以前AI画画,有时候让你输入一长串描述,它还画不好。或者让你改改图,结果细节全变样。GLM-Image这次不一样了,它用了个叫“自回归+扩散解码器”的“混搭”技术,让它特别擅长理解那些复杂的、需要“全局观”的指令。比如,你让它做一个海报,上面要有标题、图片、还要排版好看,它就能做得比之前很多AI都要好。不光是画图,它还能根据文字生成高细节的图片,也能让你把一张图改得更漂亮,或者保持人物、物体的样子不变,换个背景。
为什么说它重要?因为这是第一个真正意义上,从头到尾都在国产芯片上训练出来的、顶尖水平的多模态大模型。以前很多厉害的模型,训练都需要依赖国外的芯片和技术。这次,智谱用了华为的昇腾芯片和昇思MindSpore框架,证明了中国自己的算力,完全可以支撑起最前沿的AI模型研发。
GLM-Image在中文理解和渲染方面尤其出色。那些复杂的汉字、需要精准排版的图文结合,它都能搞定,在很多公开的评测里,它在同类开源模型中都排到了第一。而且,它还能灵活地生成不同尺寸的图片,从1024到2048,不用重新训练就能适应。
现在,这个模型已经在GitHub和Hugging Face上免费开放了。而且,使用它的API的价格非常亲民,一张图才0.1元,这大大降低了创作者的使用门槛,也为国内的AI生成技术普及铺平了道路。智谱也说了,未来还会推出更快、更划算的版本,让更多人能用上、用好这个国产大模型。
精选评论
评论加载中…