最近是不是被满屏的GPT-4o"吉卜力风格"画作刷屏了?作为一个从上周五就开始沉迷生成龙猫风格头像的人(是的,我把全家微信头像都换了一遍),我发现AI的"审核底线"真的很有意思——为什么它能痛快地模仿吉卜力,却会拒绝你某些脑洞大开的请求?
01 AI界的"神之手":一位哲学系毕业的程序媛
想象一下,每天上班就是决定"哪些脑洞可以成真"是什么体验?OpenAI的模型行为负责人Jang最近分享的内部博客,简直像打开了AI审核的黑匣子。(悄悄说,这位小姐姐23年就提出了"模型即产品"的概念,斯坦福CS专业出身,却自曝最有用的专业课是哲学课,是不是很有"造物主"既视感?)
02 从宫崎骏到表情包:AI的创作自由清单
现在可以嗨玩的操作:
- 🎨 名画风模仿(所以全网都是宫崎骏风)
- 👀 "把眼睛P得更亚洲一点"(以前会被误判种族歧视)
- 📚 带敏感符号的教学内容(比如讲解纳粹标志的历史课)
绝对不能碰的红线:
- 🚫 涉及未成年人的内容(审核最严领域)
- 📸 公众人物恶搞(黑名单可自主申报退出)
- ⚠️ 仇恨符号的滥用(教育用途除外)
03 审核员内心OS:我们也在拆盲盒
Jang坦言每次更新后,团队都会被用户创意暴击:"原来还能这样玩?!"他们现在奉行三大原则:
"AI实验室员工不该当创意警察"
—— 比起预判所有风险,更相信用户的善良
"不能因为有人用菜刀伤人
就禁止所有人切菜"
—— 拒绝"被害妄想式"审核
"最可惜的是那些
因为过度保护而胎死腹中的好点子"
—— 在看不见的地方,可能埋葬着最棒的创意
04 那些令人挠头的审核案例
名人照片难题:
"总不能让AI来判断谁够'大牌'吧?最后我们搞了个自助退订名单——被画本人说了算。"
"政治正确"反噬:
"以前AI拒绝'把眼睛修成亚洲人样'的指令,反而暗示了这些特征有问题,这不更糟糕?"
仇恨符号悖论:
"完全屏蔽卍字符,历史课怎么上?我们现在像拆弹专家一样区分教学和恶意使用。"
05 现在你遇到的大多数拒绝...可能是个bug
连Sam Altman都亲自下场道歉:目前很多拒绝其实是AI在"脑补不存在的规则",Jang用同事的金句总结现状:
"永远停在港口的船最安全
拒绝一切的AI最省事
但这不是它们存在的意义"
所以下次被拒不妨:
1️⃣ 刷新对话重试
2️⃣ 换个描述方式
3️⃣ 默念"这货又在幻觉了"
已经在玩GPT-4o的小伙伴,来聊聊你的体验:
- 生成过最惊艳的作品是?
- 遇到过哪些离谱的拒绝?
- 你觉得AI审核该松该紧?
(悄悄说,我用"吉卜力风格+赛博朋克"混搭出的机械龙猫,现在是我的手机壁纸~)
网友评论