meta 推出ai 内容审核系统升级

Meta在周四推出了一项重磅技术，把成人骚扰内容检测率直接给翻倍了，并且同步上线了7x24小时的智能助手，把Meta的全球AI内容审核系统升级了。这次动作背后的意图很明显，就是想彻底甩掉对第三方人工审核的依赖。具体来说，就是把图像重复审查和应对对抗性行为者这种高强度的活儿全都交给AI干。 Meta让后台的人类专家回归老本行，专门负责系统培训、评估和申诉处理这些高风险决策。其实这是AI在接管了一线工作后，把人的精力给解放出来了。这套新系统的表现相当亮眼，早期测试显示它检测成人骚扰内容的能力比传统审核团队高了整整两倍，错误率更是降低了60%以上。 Meta还能通过监控登录地点和密码更改这些异常信号来识别欺诈企图，每天能拦截大约5000起诈骗行为，这在很大程度上防止了名人账号被盗的风险。除了强化安全防御，Meta还把目光投向了用户体验这块儿，给Facebook和Instagram用户配备了基于Meta AI的智能助手。值得一提的是，Meta在内容规则这块儿已经慢慢宽松了很多，现在的策略更像是在往X那边靠，也就是以前的Twitter那种社区协作审核模式。之所以要这么改，主要是为了应对监管机构在青少年保护上发起的一连串诉讼，Meta想通过技术手段找到“个性化内容呈现”和“平台安全”之间的平衡点。从行业大趋势来看，这一举动不仅让大型科技公司的运营成本得到了优化，也标志着社交媒体治理正式进入了由大语言模型驱动的自动化防御阶段。OpenAI搞的GPT系列模型和Google的LaMDA都是典型的大语言模型。还有就是X平台也在琢磨怎么用AI来检测仇恨言论和虚假信息。埃隆·马斯克接管Twitter后把内容审核策略给变了个样，变得更加强调言论自由。参考Gartner每年发布的技术成熟度曲线就能看出来新兴技术的前景。欧盟那边也在赶制AI法案来规范技术使用，保护公民权益。这对Meta这些平台来说都是不小的挑战。毕竟以后平台的合规边界更多地要看算法准不准来定了。