鉴黄师工作是否能完全交由机器完成识别?
>首页 -> 社会专题 -> 有书有道 2015-11-07 来源:新浪网 作者: 【】 浏览:696

图片来自搜狐网:走文艺的麻小花  的分享

  鉴黄师,一个因为“扫黄打非”的需要而设立的特殊岗位。其工作内容,就是鉴别淫秽内容,包括光碟、互联网视频等,并根据内容开具鉴定结论。听起来只是坐在电脑面前,看看黄片,判别一下,还能够拿工资。但是实际上,这份工作并不容易,每天看片14小时刺激却很惨,每天审核10000张图片,恶心到吐对职业素养要求之高,同时也影响着鉴黄师的身心健康。

  选拔:已婚,品行端正 年薪:20万

  从事公安系统鉴黄师的选拔标准没有明确细致的规定,但在实际选拔中,还是有所选择。  

  插播:鉴黄师修炼手册

  据《齐鲁晚报》报道,想要从事鉴黄师的最基本条件就是已婚。“已任历下公安治安大队二中队副中队长的张宁还记得,2010年3月份领导找他谈话时,第一句话就问他:“结婚多长时间了?”张宁回答:“有五年了吧。”而后,领导交给张宁一沓材料,让他好好学习。根据市局规定,鉴黄工作由各公安分局治安大队负责,指定两名民警同时进行,其他人员一律不得参加。

插播:鉴黄师修炼手册

  据《成都商报》报道,成都市公安局治安大队的鉴黄师李老师表示,领导在找他谈话时明确提出这个职务需要年龄稍微大一点的、品行端正、政治觉悟高且看后不会出任何问题的优秀警察来担任。

  2013年4月,曾有某安全网站联盟公开招聘鉴黄师。其职位要求是熟悉世界各国对淫秽色情信息的认定标准;熟悉中国法律方面对淫秽色情信息的认定标准、明文规定;熟悉中国互联网、各大运营商使用过的对淫秽色情信息的鉴定标准。此外,还要求年龄20-35岁之间,性别则不限。

  首席信息安全官网创始人张百川在接受《南方日报》采访时表示,现在很多网站面临的问题就是鉴定难。很多情况下,淫秽网站和艺术网站较难区分。包含裸露图片的网站,应该属黄色网站;但如果尺度收小,又可能被某些人辩解称为“艺术网站”。

  他认为,淫秽色情鉴定官的职责,是既不能漏了淫秽网站,又不能过滤掉艺术网站。从这些方面看,淫秽色情鉴定官这一职位就很有必要。

  网上还有一份鉴黄师的笔试题,可以看出这份职业对从业者知识储备的要求。

  1,央视给大卫雕塑打上马赛克,引来争议。还有哪些伟大的艺术作品经常被误认为是色情作品?

  2,在机器学习领域,对色情内容进行鉴定时,常涉及哪些数学原理及公式?请详述。

  3,详述日、美、欧对色情淫秽的分级体系及优缺点。

  4,针对《被解救的姜戈》被叫停下线一事,谈谈对中国内容分级制度的建议。

  5,翻译一段日语。

  根据光明网报道,目前国内从事该类职业人并不多,而很多网络安全公司,也并没有专门设置这样岗位。一位网络安全公司人员透露,虽然这个岗位从事人员不多,但是对于知识要求非常专业,需要了解互联网最新动向,以及对我国这方面法律法规了解。

  待遇:年薪20万

  在公安系统的鉴黄师其实就是民警,其待遇与普通民警无差。据历下公安治安大队副中队长张宁表示,鉴黄只是自己工作的一部分,无片送检时,他还有其他工作要做。

  不过企业鉴黄师招聘的待遇着实让不少人激动了一下。上文提到的安全网站联盟的招聘启事中,“明码标价”提供年薪20万。工作地点北京。它的福利也很诱人:国家标准五险一金及餐补、交通补助、通讯补助,随时报销图书购买费用,每天额外的水果、酸奶福利;此外,还有每年一次的员工关怀体检,生日、结婚、生育贺礼。

  90后女孩阿紫应征这个岗位的原因也是20万元的年薪。

  工作:“脑子里只有淫秽色情的标准”

  “起初,确实有点紧张,还有些呼吸急促。”济南历下公安分局的鉴黄师张宁说。他第一次鉴黄时,尽管当时已夜深人静,单位里除了他和另一名鉴黄的同事外早空无一人,可他们还是反锁房门、拉上窗帘、戴上耳机,生怕那些不堪入目的画面或是淫荡的声音传出去。“那感觉有点儿像做贼似的。”张宁说。即使现在,他们审片时也几乎如此。

  90后美女鉴黄师阿紫试操作第一天也遭遇了尴尬。她点开一个文件,一张裸体图片映入眼帘。阿紫“啊”地惊叫一声,随即赶紧捂住嘴,用眼角瞥了瞥周围的同事。这对于年轻的阿紫来说,这份工作还意味着需要恶补很多“知识”。在男同事的推荐下,她开始浏览黄色网站。

  对于成熟的公安民警来说,鉴黄工作就和其他工作无异。“鉴黄时,我脑子里只有淫秽色情的标准,是否公然宣扬色情,是否赤裸裸地描写性场面等。”这工作不像刑警办案那样有成就感,但张宁也觉得责任重大。张宁需要给每张黄盘编号、审查鉴定,遇到可疑的地方还需要退回去仔细辨别,“因为我们的鉴定结果直接决定着对犯罪嫌疑人如何量刑”。他打了个比方,这就有点儿像妇科医生看病,只管对方有没有病,有什么病,“心无杂念,只有工作”。

图片来自网易

  鉴黄师们鉴定的标准很严格,首先要对《国家新闻出版署关于认定淫秽及色情出版物的规定》十分熟悉,只要符合其中一条,就算是淫秽物品。但是,关于性知识科学性的东西是不算淫秽的。艺术片、性科学知识,都与淫秽有些接近,但这两种不属于淫秽物品。如果影片中偶尔有个色情镜头,整体并不露骨,这类影片也不属于淫秽物品,也就是说,一些港台产的香艳影片也不能归到淫秽片当中。

  2012年4月,哈尔滨公安局治安支队鉴黄师刘春琪参与抓获了一起重大涉黄案件。该案中涉及的黄色“视频资料”有20多万份,接到指令后,刘春琪把自己关在办公室里审黄片,除了吃饭上厕所,剩余的时间都在鉴定工作中,累了就躺在沙发上打个盹,醒了就接着工作,一直工作了20多天才将这批“视频资料”鉴定完。  刘春琪说,这些黄片中有很多龌龊的画面,看这批黄片时他吐了不知有多少回,但一想到同志们辛辛苦苦抓到犯罪嫌疑人后,因为没有涉黄鉴定书,犯罪嫌疑人多次推翻口供和狡辩,刘春琪认为再苦再累也值了。

  随着鉴定经验的不断丰富,鉴定速度也越来越快。但在鉴定过程中,艺术与淫秽之间的模糊界线是个难题,有的艺术片会夹杂一些特别镜头,因此,这类片子就需要从头到尾把片子看完。“一般不到一分钟就可鉴定完毕,最快只要几秒钟,只要符合《规定》任意一条就可给它‘判刑’,最多一次鉴定了13万余张。”成都市公安局治安大队的鉴黄师李老师说。

  影响:难以启齿的职业  哈尔滨公安局治安支队鉴黄师刘春琪从治安民警转为鉴黄师后,他一直向家人刻意隐瞒。

  刘春琪刚当鉴黄师那会儿,同事们经常调侃他,让他讲讲黄片里的内容细节,讲讲自己的感受,他都是一笑了之。

  有一次,刘春琪的妻子打来电话,他当时正在审黄片,妻子在和刘春琪的通话中听见了男女的呻吟声,惹怒了妻子。她认为刘春琪有外遇了,并告状到刘妈妈那儿,刘春琪被刘妈妈喊回家训话。无奈之下,刘春琪告诉家人他现在是鉴黄师,刘妈妈听后就犯了心脏病。后来,在单位领导的开解下,刘家人渐渐理解了他的职业。

  关于工作内容,阿紫也一直不敢和家人说实话。同事被问起工作时,也都会说是开发电脑软件或说是网络编辑搪塞过去。连公司没有给她正式的职位名称,对外只宣称“网络编辑”。

  最后,她还是选择了辞职。不过直到离开,她也没告诉男友自己的工作内容。

  一方面是工作内容的“难以启齿”,另一方面鉴黄师往往承受着心理、生理的双重压力。

  重庆医科大学附属第一医院心理卫生中心主任蒙华庆表示,鉴黄师长期从事鉴黄工作,更需要对性常识有全面了解,还要拥有健全的心态,否则容易受“三级片”中变态性行为的影响,对常规性生活方式失去兴趣、甚至厌恶性。对性诱惑的抵抗能力不分男女,关键是看其是否拥有健康心态。从健康角度出发,警方应安排多男多女一起鉴黄,让民警真正把鉴黄当成一项普通的工作。“鉴黄师”一般应在30岁以上,拥有稳定的婚姻关系。如果鉴黄时间过长,建议及时与专业的心理医生沟通交流。    

  现在,色情淫秽视频早已不是仅仅依靠光盘传播了,它们依靠互联网进行快速和海量传播传播。这种人工的鉴别方式,也遭受到了质疑。一位互联网资深人士表示,鉴别色情内容,一方面可以机器自动化处理,需要图片处理方面的技术人才就行。另一方面是招聘淫秽色情鉴定官这样的人,但鉴于互联网的海量内容,恐怕不是几个人能搞定的。“youtube采用的就是用户举报人工审查的方式过滤淫秽内容。”

  曾经听前Google XLab某Scientist讲段子说过youtube怎么识别黄色视频的。

  Youtube每天上传的视频量估计比百度云一个月都多,他们有一个专门的大团队来鉴黄。

  当年他们认为高大上计算机视觉是可以解决这个问题的,于是乎他们花了大量的时间和金钱使用了各种高大上的算法在视频里面检测裸体,什么颜色啦,动作啦,人脸,器官识别啦。

  几个月过去了,然而并没有什么卵用。

  两大问题,一是速度太慢。二是准确度还是太低。

  后来有个神哥们临危受命加入这个组,万万没想到,这个问题被他解决了。后来这哥们在google research混的风生水起。你知道他是怎么解决的吗?

  现在,百度云如何鉴别不健康的内容哪?

  先来看一段知乎网上一位网友介绍:

  干这个确实需要大量的训练数据。当年中科院计算所有一个组在做这方面的国家项目,黄色+反动内容识别。人家都是带着条子和公款去国外采购影片和轮子的东东回来做训练数据的......

  我不懂事的时候有个女朋友花钱太厉害,逼的没办法去一家前著名论坛网站打零工做过类似项目,不过是自动识别黄色/反动的文本......

  他们有积累了很久的人工识别的数据。招了不少人做类似鉴黄师的工作,三班倒每班连干八小时,拿一个简单的搜索引擎对用户发布的内容不停地用各种关键词搜,看到不该看的就删帖+搜集起来。然后这些人工识别的数据拿来给我们训练自动识别模型。

  具体百度网盘是怎么做的,我猜是机器学习+MD5识别。如果我来干这个的话,先按照经典的方法做一个模型出来,特征就是视频图像识别的特征+文件名文本特征+文件格式,大小等特征。模型拿个常见分类器就行了。

  估计音频特征也可以,porn的音频特点也很明确(日语 or 英语那些词太明显了),一抓一个准。

  继续丧心病狂的话就加视频特征。连续多帧里面人数量的变化啦(人数量相对固定,大都是一到两个,三四个也有,再多就不是那么常见了);人物移动的pattern啦(很少大范围的移动,而更多是小范围的往复运动);发生的场景啦(大都是室内小空间,并连续很多分钟都是一个场景啦,偶尔有一些外景)。

  不过我觉得完全不需要这么复杂就可以做到很高的准确率了......

  有模型之后,每隔一天或者几天,具体根据模型效率和机器的负载来决定,在网盘的图片和视频数据上跑一遍,把不该有的东西干掉,然后记录下MD5码。

  这些MD5码就是黑名单了,往后每次用户新上传的时候就用这个MD5码做一次判断,不该有的就不让你传了。就是一次哈希查找,效率很快,根据百度网盘本身极速上传功能推断,百度已经有了很成熟的MD5操作的模块了。

  这两个加起来就既满足了效果(靠机器学习模型每隔一段时间的精确判断),也满足了效率(MD5实时校验)。  

您看到此篇文章时的感受是:
Tags: 责任编辑:佚名
免责申明: 除原创及很少部分因网文图片遗失而补存外,本站不存储任何有版权的内容。你看到的文章和信息均来源于互联网,本网转载,并不意味着赞同其观点或证实其内容的真实性.如涉及版权等问题,请立即联系管理员,我们会予以更改或删除,保证您的权利.对使用本网站信息和服务所引起的后果,本网站不作任何承诺.
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论:0条】 【关闭】 【返回顶部
更多
上一篇读心术教你如何看透一个人 下一篇唐代书法四大家之《颜真卿名品全..
密码: (新用户注册)

最新文章

图片主题

热门文章

推荐文章

相关文章

便民服务

手机扫描

空间赞助

快速互动

论坛互动
讨论留言

有事联系

有哪个那个什么的帮忙赶紧点这里给DOVE发消息

统计联系

MAIL:gnlt@Dovechina.com
正在线上:

版权与建议

任何你想说的