需要一套全新的评价体系
这几天内部一直在讨论研究的问题。


评价体系问题是个终极问题;比如围棋棋力的评价方法,是看胜负率。而围棋胜负的规则是明确的。目前一般认为,凡是规则可以在数学上绝对明确的问题,计算机对其的解决能力都必将超过人类,限制仅仅是摩尔定律而已。


这也许会使得围棋的魅力大大衰减:
以前在网上下棋,便仅仅是下棋而已。后来象棋的魅力就大幅衰减,因为象棋的规则对于计算机来说过于简单了(反而对人来说比较复杂),因此在网上下棋时,如果没有聊天的过程,几乎无法判断对方是否是一台计算机。而围棋是个特例,围棋的规则虽然明确,但看起来似乎更适合人类解决。所以围棋一直保持着它识别真人的功能。如今alphago的出现,让围棋的这个“代表人类”的魅力不复存在了。


将围棋的胜负作为一个评价标准,也许10年之后,世界前10分别是google,facebook,baidu(不太现实哈)…… 可见,这个评价标准并不利于团结人类围棋玩家,反而有可能导致围棋作为一项运动走向冷门。


目前最吸引人类玩家的,是类似DotA,LoL,以及SC这类即时策略型游戏。这些游戏的局面复杂度,远超围棋,大概是 10^80 vs 10^8000 的级别;因此还没有计算机玩家能战胜最强的人类玩家(至少15年内做不到)。这类游戏的吸引力之一,就在这里。


反观论坛,亦是如此。
每一个论坛都有它的一套评价体系。不同的评价体系,将鼓励不同的行为。如果一项评价体系,让高水平的人愿意参与讨论,低水平的人愿意虚心学习,有独特见解、新颖想法的人愿意发表,对类似科创这样的论坛来说就是好的评价体系。如果科创的评价体系鼓励机器人灌水,马上自然人就跑光了;如果科创的评价体系鼓励政治正确的言论,马上愿意认真讨论问题的的人就跑光了。所以评价体系是终极,是关键。至于具体一个评价体系怎么实现,另论。


几个初步结论:
1. 时代在变,不要把评价体系内也需要跟着改变的部分定死。
2. 绝对民主将产生糟糕的评价体系。既然科创要产生能够超越科创的人和事,就不要期待这些人和事会得到大多数的认同。
3. 目的要明确。科创的终极目的,是解决那些能够改变世界,但在其他框架下无法解决,或者解决得不好的问题。


特别谈一下目的。
为了实现这个终极目的,
既需要坚持科学理性原则,也需要团结三观有别的杰出人士;
既需要严格限制民科毛左伸手党,也需要保证所有人平等的发言权利;
既需要避免偶像崇拜,也需要那些有杰出贡献的人来做榜样。


上面三条,每一条都是自相矛盾的。对于这种矛盾,我的回答是:美国人接受这种自相矛盾,而中国人从来不接受。
来自 科学技术学
2016-3-11 23:04:33
1楼
论文杂志都有评审团



补充:论坛的评审团只做正面评价。   novakon说的引导部分,我觉得得请人做老师级的巡视员。

[修改于 3 年前 - 2016-03-12 00:59:00]

折叠评论
加载评论中,请稍候...
折叠评论
novakon(作者)
2楼
引用 20!不曾存在:
论文杂志都有评审团
你如果真的很闲,建议马上到科创网络发展局报道,起薪10k。不要犹豫。

好,下面回答你的疑问。
论坛的rudolf同志出售特斯拉套件,然后在论坛遭到了第三方的攻击,指出其套件质量不好。按照您的“评审团”观点,山猫版主以“科学理性”为原则做出了初期评审,评审结果:rudolf的模块,型号是伪造的。如果我们一路坚持“科学理性”原则,结果就是从此rudolf就再也不上论坛发帖了,而会员也对特斯拉线圈产品热情骤减。
现在麻烦的问题,不在于没有评审制度(事件的最终处理是KC内部集体评审的),而是对这个评审的原则,缺乏一个比较容易理解执行的描述。如果什么事情都要集体评审,恐怕论坛就真的会变成论文杂志。变成论文杂志的论坛,大家肯定就只看不发言,人气越来越低。

如果你真的有兴趣和脑力研究这些问题,欢迎加入KC网络局。
折叠评论
加载评论中,请稍候...
折叠评论
novakon(作者)
3楼
一般人都把科创当做一个论坛,只知道它便于交流的作用。其实科创还兼有教育的作用,一个人来到科创一段时间之后,思想观念是会发生改变的。如果入口卡得太紧,就会令科创失去教育的作用;而没有了教育,就等于失去了宝贵的补充水源,最终交流也会干涸。
折叠评论
加载评论中,请稍候...
折叠评论
2016-3-12 00:17:34
4楼
     我没玩过刀塔和撸啊撸,以红警3来说,如果在一张大地图上和电脑对战玩多线操作,受到手速的限制人工无法具体操作每个作战单位,让其精确走位并且在血量耗尽前脱离战场回后方恢复。而电脑不存在这方面的限制,它可以同时操纵100个或者更多的作战单位互相配合作战,操控几个人发出一下齐射刚好打掉对方一个单位而不会浪费弹药和兵力,也能根据自身血量和受到的攻击很快计算出何时后退保命最合适。目前的很多游戏中电脑的作战方式非常单一,经常会采取一些愚蠢的做法,这其实是因为游戏开发者并没有像google工程师那样费心去研究AI,仅仅是为了大众娱乐而弄的很粗糙的程序。如果让阿尔法狗配上精心设计的程序,我相信电脑在此类游戏中战胜职业选手并非难事。当然除了一些特殊情况,比如两者在小地图上对战正好兵种相克,前期一顿猛冲直接干掉对方基地gameover。
折叠评论
加载评论中,请稍候...
折叠评论
2016-3-13 14:07:16
2016-3-13 14:07:16
5楼
引用 rudolf:
我没玩过刀塔和撸啊撸,以红警3来说,如果在一张大地图上和电脑对战玩多线操作,受到手速的限制人工无法具体操作每个作战单位,让其精确走位并且在血量耗尽前脱离战场回后方恢复。而电脑不存在这方面的限制,它可以同时操纵100个或者更多的作战单位互相配...
这点的话,以红警为例,高手基本都是非常好的操控的,你可以去看,我见过最厉害的是4辆苏联灰熊干了7个残酷,。而且即时战略有一点就是大多数情况下,是需要依靠RP的。
折叠评论
加载评论中,请稍候...
折叠评论
6楼
引用 rudolf:
我没玩过刀塔和撸啊撸,以红警3来说,如果在一张大地图上和电脑对战玩多线操作,受到手速的限制人工无法具体操作每个作战单位,让其精确走位并且在血量耗尽前脱离战场回后方恢复。而电脑不存在这方面的限制,它可以同时操纵100个或者更多的作战单位互相配...
可以让AI模拟单线键鼠操作,AI操作速度不能高于键鼠的信号传递速度
折叠评论
加载评论中,请稍候...
折叠评论
7楼
先暂时不说评价,就说说交互型网站的筛选。

纵观国内的专业论坛,人气比较好的,通常都具备强筛选特性。这与人们的直观认识相反,强筛选意味着人口覆盖面狭窄,为什么人气会比较好呢?

其实,有效的网络交流主要发生在基础实力势均力敌的网友之间。如果悬殊太大,那么这样的网络交流偏向于单向的知识流动,难以形成有效互动。这种情况下,如果论坛文化尚可,就会倾向于装逼向;如果论坛文化不佳,网友回帖过于消极,就会趋于冷清。所以,人口覆盖面宽不一定有效,同样会因为交流效率低,高水平用户的体验差,而导致交流水平差——长期下去,人气也不会好。

但是,网友总有成长过程啊,假如一定要技术水平接近的网友才能发言,就真的会挡住一大批有兴趣的人。所以,关于“势均力敌”,通常是指文化素质上势均力敌,这些人应该知道如何与人友善的相处,如何正确的讨论(而不一定懂得技术),如何尊重“老师”并使得大家都能愉快的积极发言。举个例子:在技术讨论中,诸如中医思维这类极为有害的思维,就不应该表现出来。筛选制度的目的,是把这一部分人筛选掉,或者使其弱点不容易暴露出来。

对于专业性社区,容易达到这些目标。但对于像KC这样的综合型社区,要达到这样的目标就很难。例如,许多网友在技术方面水平是很高的,例如论坛上的有几位留学生。但是,一旦论坛上出现一些哲学或者政治学话题,这些人倏地一下就蹿过去,发表一大堆毛左言论。这些毛左言论对于技术社区极为有害,按律应当封号。如果封号的话,又会打击其技术热情,使得技术板块受到伤害。

对于这类情况,就应当通过论坛的程序,对不同类型的话题和人员进行非常有效的隔离。我们都知道隔离是不好的,但这里为什么隔离会变得有效呢?这是因为适当的隔离能够保护交流的效率和参与人员的积极性,也就是降低高水平发言者交流体验的边际效用下降的速率。

筛选和评价尽管“政治不正确”,但确是必不可少的。就像决定国家政策的必须是政治家,而不能是键盘党一样。对于论坛也是一样,难点在于,如何在最大限度的保护宽容性的前提下,进行恰到好处的筛选。这需要从架构、程序、管理制度、管理员培训、文化建设等多方面努力。

[修改于 3 年前 - 2016-03-13 23:52:37]

折叠评论
加载评论中,请稍候...
折叠评论
2016-3-14 01:00:24
8楼
引用 俗世怂人:
这点的话,以红警为例,高手基本都是非常好的操控的,你可以去看,我见过最厉害的是4辆苏联灰熊干了7个残酷,。而且即时战略有一点就是大多数情况下,是需要依靠RP的。
那是红警2.如果在3里面玩大地图1对1,不一开始就强冲的话,慢慢打真够就够喝一壶的。
折叠评论
加载评论中,请稍候...
折叠评论
9楼
引用 rudolf:
那是红警2.如果在3里面玩大地图1对1,不一开始就强冲的话,慢慢打真够就够喝一壶的。
红2的话,我只要一开始没被打死,真的是十分钟一盘,红3的AI确实不错,很强大,但是红三也有很厉害的人啊,见过几个兵切换好几乎无损爆基地
折叠评论
加载评论中,请稍候...
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

ID:{{user.uid}}
{{user.username}}
{{user.info.certsName}}
{{user.description}}
{{format("YYYY/MM/DD", user.toc)}}注册,{{fromNow(user.tlv)}}活动
{{submitted?"":"投诉"}}
请选择违规类型:
{{reason.description}}
支持的图片格式:jpg, jpeg, png