LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: qinpu

强烈建议加强论坛搜索性能和功能,请各位版主和管理员进来看一下

[复制链接]
发表于 2003-5-29 18:09:27 | 显示全部楼层
普通文章的索引不好建,我与北南讨论过这个问题,由于是普通文本索引几乎无法用关键字建,但不建索引会更慢。由于论坛的贴子越来越多,如果不用索引用户多了会更慢。

针对这一情况各位可以群策群力想一些办法。

我当时想用集群的办法来解决,但考虑本论坛目前情况,如果用集群的话硬件投入会直线上升,也是不现实的。
目前只能想一些巧妙方法来解决,我想即使用oracle,贴子这么多一样快不了多少,因为普通文本文章(汉字)在数据库里处理不是数据库特长。
发表于 2003-5-29 21:15:05 | 显示全部楼层
我想还是延用现在的Mysql加PHP模式,毕竟论坛是个以交流为主的地方,真要搜索的话有Google,可以提供更多的答案,功能的强大也不用多说。而且就算用技术解决投入会比更大,咱们目前的能力财力都有限,我想等文章管理系统出来以后大家还是把精力花在文章的整理管理上,科学合理的分门别类,有问题就像有生词查字典一样方便,而且我们每一个人都可以参与整理,不断扩充这个问题宝典。
 楼主| 发表于 2003-5-30 22:10:45 | 显示全部楼层

这个方法能不能在目前改善一下:

按照 Haides 兄的指点,如果我们现在发贴子,尤其是那些综述性,介绍性的帖子,人为地利用拆词这一特性来突出一些可能的关键词,比如用前后加空格的办法截断相关词,是不是会改善一点中文的搜索?

比如在一段关于电源管理的帖子中,如果这样写
...我们这里讨论的 挂起 问题,有几种类型,....
...首先要系统的 内核 支持 ACPI,...

这样是不是好一些?
发表于 2003-5-31 17:10:03 | 显示全部楼层
还好的啦!
这样linuxsir比较有个性
发表于 2003-5-31 20:30:44 | 显示全部楼层

mnogosearch

这个问题。。没有那么严重罢我想,更不要说放眼国内云云。。。这太夸张了。

给个建议:用mnogosearch来做一个独立的搜索页面(类似google,不过只搜本站)。我用过,且数据量只比这个坛子大。

最新版本的mnogosearch对中文的支持也还可以,不过,要用utf-8而不是gb2312。还好,它自己会将搜索到的结果转为utf-8 。这点和google也是一个意思,跨多语言的搜索。

用mnogosearch的好处是,基于php+mysql,和现有论坛独立也无关,甚至可以放到别的机器上去;它的c程序每日很可爱的自动扮做机器人状,仿佛一个普通用户一样来访问要索引的网站,索引它能看到的所有页面,更新建立独立的全文索引;它的php接口则接受别人从web界面进行的全文检索关键字,返回检索到的url列表让人看,点该url就可以开原始url阅读,等等。

php4.3后mnogosearch已经作为一个模块,可选编译到php内;俄国人的优秀搜索算法,服膺。

唉,几句话是说不清楚啦,去mnogosearch.com看看罢。有时间的朋友可以去装一个试验看看,性能真的不错的说。
发表于 2003-6-1 17:33:19 | 显示全部楼层
我用iptables ftp 搜索服务器架设坛子
怎么搜也不行,报错
Fatal error: Maximum execution time of 30 seconds exceeded in /opt/apache/htdocs/bbs/search.php on line 399
发表于 2003-6-1 22:18:16 | 显示全部楼层
用单个关健词来找就方便点。搜索功能不太好,只能用单个关健词。

比如:

http://www.linuxsir.cn/bbs/searc ... ortorder=descending


http://www.linuxsir.cn/bbs/searc ... ortorder=descending
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表