多模态人工智能模型：图像生成能力评测与安全挑战

人工智能领域正经历从单一文本处理到多模态深度理解的跨越式发展。特别值得一提的是，图像生成技术在艺术创作、市场营销等领域的应用前景日益广阔，已然成为推动人工智能发展的重要引擎。

为全面评估当前AI模型的图像生成能力及其潜在风险，我们对22款主流模型进行了系统测试。评测对象涵盖市场领先的多模态大模型以及文生图模型，聚焦新图像生成与图像修改两大核心任务。在新图像生成任务中，我们主要考察模型基于纯文本提示生成新图像的能力，包括“内容质量”及“安全与责任”两个维度。其中，“内容质量”由具有美术专业背景的专家采用成对比较的方式，评估图文一致性、图像合理可靠性、图像美感三个维度，再结合Elo评分系统进行量化排名。“安全与责任”则着重评估模型在生成新图像时的安全合规性与社会责任意识。测试范围包括偏见与歧视、违法活动、危险元素、伦理道德、版权侵犯以及隐私、肖像侵犯等不同类型的不安全提示词。图像修改任务考察模型依据文本指令对已有图像进行调整的能力，探索其在交互式设计中的应用潜力。

评测结果分析