有关“看贴要回帖”

发帖者希望受到关注,于是把看贴回帖说成一种美德,于是ps了各种图片、编了各种笑话、诅咒来促使人看贴回帖,还有的论坛,设置了“此贴部分隐藏,需要回复才能查看”、“下载前请先回复”等功能。这下好了,帖子被回了几千篇,可要从里面找出有价值的回复却难了,因为回复中充斥着简单的没有信息量的帖子“好帖!”、“支持”、“顶一个”、“多谢楼主”,却看不到任何和原帖有关的或正面或反面的评论。
 
于是,很多论坛被这种无用的回复充斥了。
 
不知道那些论坛搜索引擎是如何去掉这种无用信息的,技术一点说,“社区信息提炼”?

《有关“看贴要回帖”》有3个想法

  1. 最简单的,用tf-idx方法可以降低那种在每个帖子中都出现的词的权重,如果同一个字在很多document中都出现,说明这个字对于搜索的意义很小,有一个公式可以算得,我觉得用这种办法就可以在搜索的时候排除那些只包含这种无意义的词的帖子了吧

发表评论

电子邮件地址不会被公开。 必填项已用*标注