LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: waterloo2005

自己些个像搜狗那样的输入法程序难吗?

[复制链接]
发表于 2009-8-17 23:16:40 | 显示全部楼层
或许是大多数人都没有达到愚民兄所说的那个“境”。我说这个话不是讽刺或者什么,道家的东西我还是看了一些,对“境”这个概念还是略知一二。

那个的确是个文字游戏,因为你反驳eagle_m 是站在了一个你已经认定了,但是没有证明的观点上面。而你把这解释为“境”这种玄之又玄的概念,又断了别人和你讨论的可能性,因为看法不一样即“境”不到。觉得这种优越感叫人受不了,于是套用你反驳的模式开了个小小的玩笑。

愚民兄也说,就你个人,打单字的机会比打词的时候多,输入法不同,这一点是没法统一的。对于大多数拼音用户,打词的机会远远多于字。这是不同输入法的不同特点造成的拆解语言的方法不同。
词组记忆并不是很好的法,只是想尽量回避单字而弄的没办法的法。它并不能解决单字能力不好的问题。
愚民兄这句话很巧妙,这个法字就可以算一个单字的代表,而没办法的法更是换用没办法的办法,来体现了你所使用的输入法在直接输入单字上的优秀。
回到话题上来,虽然是回避,回避得是否成功呢?即便上面这种变用,我也可以一次上屏。这不是说拼音从根本上解决了单字输入的问题,而是现行输入法输入单字的机会太少了。即便输入,真的,那些你习惯输入的字词频都很高。“我们”和“威猛”这样的错误的确在拼音输入不仔细的情况下是存在的,但是这些真的很常见吗?别的不说,五笔下也会有这样的错误,有时候看东西,你会突然感叹,打这本书的人一定是用五笔的,拆字拆错了。

好东西,和作家,也是两个很难界定的概念。
我只是知道输入法面对的是用户,用户的职业各种不同,用户用输入法输出的东西各种各样,愚民兄这个所搜狗打不出好东西和真正的作家一定不用纯拼音输入法过于绝对了。

单字能力缺失的确会让表达出现问题,但不是说解决单字问题的唯一途径是直接打单个的字。我之前说了,现行的拼音输入法可以很好的回避这个问题,而真的,语言真正拆解到单字的很少,而这些单字往往词频都很高。

我的输入法每页五个字或者词,横排,空格定首词,左右shift 定2,3词。
我先说说我打字的习惯,我很少使用简拼,因为方言的限制,前鼻音和后鼻音我以前分得不是很清楚,为了纠正,就关掉了模糊音,后来差不多纠正了,也养成了这个习惯,恰好也避免了重码。输入中具体有多少简拼,我没法统计,这个是习惯的问题,手到了键盘上面,自己打出了这些东西。

第二天(1)是个(1)阴霾(1)多云(1)的(1)日子(1)。殡仪馆(1)的(1)人(1)在(1)昨夜(2)执行(1)完了(1)他们(1)的(1)任务(1),把尸体(1)裹在(2)一块(1)包(2)尸(以词定字,输入的尸体 2)布(4)里(1),尽管(1)有人说(1)死亡面前人人平等(1),但包尸布(上次是分解成字,这次输入了这个词,翻页最大 3)却要(1)最后(1)证明(1)他们(1)生前(1)的(1)奢侈(1)。这块(1)包尸布(1 已经记忆了)是(1)瓦朗蒂娜(1)在(1)半个月以前(1)刚买的(1)一块(1)质地(2)极好(3)的(1)麻布(2)衣料(3)。那天晚上(1),收(1)尸(以词定字,输入的尸体 1,词频变化了)的人,把诺提瓦尔(1)从(1)瓦朗蒂娜(1)的(1)房间(1)搬回(2)到(1)自己的(1)房间(1),让人(1)出乎意料(1)的(1)是(1):要他(1)离开(1)他的(1)孩子(1)并没有(1)怎么(1)费事(1)。布沙尼(自造词,翻页一次)长老(1)一直(1)守候到(1)天亮(1),然后(1)没有(1)同(1)任何人(1)打招呼(1)径自(3)离开了(1)。阿夫里尼(自造,未翻页,阿夫3,里尼3)是(1)早晨(1)八点钟(1)回来的(1)。他在(1)到(1)诺提瓦尔(1)房间(1)去的路上(1)遇到了(1)维尔福(1),他们去看(1)老人(1)睡得如何(1)。令他们惊奇的是(1)老人(1)在(1)一张(1)大圈(3)椅(椅子定椅)里(1),睡的正香(1),他面色(1)平静(1),面带微笑(1)。


上面是大仲马《基督山伯爵》104章《腾格拉尔的签字》第一段,括号里面是我的词频信息与自造词信息。
我打这一段不是为了说明拼音现在又多优秀,我只是还原了一个输入法在某种情况下的表现。然后讨论一些易见的优点和缺点。
从上面那一段话里面看出,基本很少出现翻页的情况,而如果是自己创作的话,这种翻页的概率会更加的低,因为自己使用的拼音输入法时间长了会很符合自己的言语习惯。比如我一直以来习惯说“裹尸布”而不是那个自造的词“包尸布”,而“大圈椅”,我不知为何物,以前没打过。

拼音不是最好的输入方式。以下以搜狗打的上面一段话说明。
1.重码,虽然很少,但是还是有一些超出了前三位。
2.很难盲打,即便大多数情况是首位上字/词,但是仍旧不稳妥。
3.首次输入一些未输入过的词会相对麻烦。

我也说说优点:
1.已经很好地避免了必须输入单字而造成的困扰,虽然并未从根本上解决。
2.词频调整和词组记忆的功能很好。大部分是一键上屏(space ,左右shift)。
3.拼音输入法有一个好处,对于大多数北方语系的人,拼音是最直接呈现思路的一种方式,因为语音的关系。

现行的一些拼音输入法,虽然限于编码问题,很难解决直接输入单字的问题,但是并不妨碍顺利的通过其他拆解方法得到这些单字。
当然,这个统计也并不科学,简单的说来就是输入的太少了,样本太小,而这个样本本身也是比较自然的语言。

这个例子可以反驳一些东西。
过多的翻页是不是真的存在?
单字问题是不是真的很严重?那些外国名字按大多未深入使用这类输入法的人的想法来说都是必须单字输入,并且翻页多次的。

最后还是总结一下。
1.搜狗包括其他一些现行输入法,解决单字输入的途径和别的编码的输入法并不一样,但是不是缺失了这个能力。
2.在只输入一个字的情况下,的确其他很多输入法可以直接就输入这个字,但是这并代表,这些字连在一起所呈现的语言就是所谓的好东西;而搜狗输入法,未必就没法很好的解决语言中的单字,也未必就造就不了那些好的东西。输入法是人控制的,即便输入法真的对人有反作用,是否真的能上升到影响民族素质的高度?而是用拼音输入法是否就决定了无法(快速)精准表达,无法创造出好的东西?
3.拼音输入,它在单字输入上不是最优的,但在整体构架思维上,对大多数人而言,是最直观的。
4.即便拼音输入法有劣势(我这么说不是说其他输入法都是完美的)。我还看过对于五笔和拼音有这样的评论——“打字员用五笔,因为他不需要知道文章意义,作家和学生应该用拼音,这样不会因为拆字而影响思维。”但是都不全面不是吗?用拼音还得面临选字(虽然我觉得很少),而用五笔熟练以后未必就老是想着拆字,拆字未必就影响思维。
5.即便拼音编码不是最优,但是它的存在不是完全没有价值,而各种编码方式并谈,搜狗拼音都可以算一个上乘的中文输入法了。得出搜狗拼音之类的输入法是个玩具真的过于草率了。
6.讨论输入模式的优劣价值不大,只求态度上不要过早下判定,而看不到其他输入法的优点和其他平台的用户的良好体验。

#####################################################

如愚民兄所说,学会一些其他的更优秀的输入模式不是很难的事情,大多人都可以做到。
如果有人觉得拼音输入没法满足,完全可以转投其他平台,输入法毕竟只是工具,怎么输入顺畅怎么来。
我一直没学会是自己太懒。

搜狗真的可算一款优秀的中文输入平台了,过分贬低,把搜狗身上某些不足扩大没有意义,这些不足在使用中真的并不明显。这个道理同样适用于其他优秀的中文输入平台。

每种输入模式都有不足。
以前有五笔用户站在很高的角度问拼音用户,你不会读的字你怎么打?拼音用户问他,你会打的字你都会读吗?


#####################################################

我相信其他输入法平台的用户也有很好的用户体验。
但是请正视一些在非你使用的输入平台上的问题,无论好的坏的,不要一上来就一竿子打死,因为我们都没法取得别人的经验,感觉这些非外现的东西。
也同样请大家讨论一个人的思维的时候真的以这个人的思维为据,讨论一个人的作品以作品为据。

搞不好什么时候时间允许,为了磨练意志,学会其他输入法也不一定。我这个人只要时间允许,还是很喜欢折腾的。


#####################################################

如果愚民兄喜欢写东西,可以尝试学一下tex ,把上屏问题丢在一边以后,再把排版问题丢到一边,tex 是所想即所得的字处理工具。


#####################################################

在这个帖子上花了太多时间,还没讨论出个所以然,这些时间都可以做多少事情了,罪过。

这个帖子我就不再参加讨论了,翻来覆去,自己也说不出什么新东西,感觉和经验这种东西又没法直接复制给别人。

#####################################################

引用三楼的帖子:
为什么我们不自己写个呢?
在开源的架构下不断完善
的确linux的普及,输入法是很重要的一环

还是把这个帖子交还给技术讨论,交还给真的懂技术的人。即便开始看起来楼主的提问有点无厘头,但是保不齐楼主或者这个版块其他人有一天真的变成大牛,解决某一部分人或者说大多数人的输入需求。这才是问题最关键的地方。
回复 支持 反对

使用道具 举报

发表于 2009-8-18 15:21:01 | 显示全部楼层
从专业角度来看,拼音输入法不适合电脑识别,打字员快速录入.因为它的重码率.
从一个用户角度来看,我们从小学的就是拼音,还有什么比拼音输入法更适合我们的吗?完全无障碍过渡,使得有接受过普及教育的人都可以轻松用上电脑.这个大市场才是搜狗公司一直关注且做的很好,我曾经也是sogou拼音重度使用者.(个人是不大喜欢词组智能记忆.一:打错字也会被记忆.二:在没有网络的另一台机子上你得重新适应.三:无法很好转型使用其它输入法.sogou 的pinyinupdate.exe这个后台程序经常出错,我已经换用QQpinyin了)
只要你有上过小学,都已经被拼音影响思维了,从中国汉字拼音化开始...我也无法肯定或否定汉字拼音化给我们中国人带来的影响.但也很怀疑拆字又会给我们的思维带来什么样的影响?
一直在使用拼音输入法,今时决定尝试一下形码输入,据闻也有音形码输入法,不是很了解.依然是万马奔腾的年代…… 
回复 支持 反对

使用道具 举报

发表于 2009-8-19 10:39:40 | 显示全部楼层
无重码(或重码极少)便是最好最准的整句

不管无重码(或重码极少)是通过少重码字词或是
人工智能或其它手段来完成的

只是现阶段的人工智能在输入上
还远达不到人的智能水平而已
回复 支持 反对

使用道具 举报

发表于 2009-8-22 12:03:34 | 显示全部楼层
——1.已经很好地避免了必须输入单字而造成的困扰,虽然并未从根本上解决。
2.词频调整和词组记忆的功能很好。大部分是一键上屏(space ,左右shift)。
3.拼音输入法有一个好处,对于大多数北方语系的人,拼音是最直接呈现思路的一种方式,因为语音的关系。


从上述话看,你没明白我说的话的意思,你将我说的“有的单字组合不是词”理解成“该有的词而输入法没有”这个意思了,因此,强调词组记忆。

我说的是指:有的单字组合本来就不应该是词。这样的单字组合随机都可能出现的。
比如说我前两天写过关于围棋的一段描述:
进攻者如群浪扑礁,此起彼伏,东西互应;防守者若高山在前,迎风拒浪,岿然不动;绚烂者落子似千花漫野,美不胜收;朴素者出手凝万象于一点,以拙胜巧。

以这段为例,比如说那“群浪扑礁”、“千花漫野”、“凝万象于一点”那样的,实际上都不是词,只是单字组合,你硬造这样的词(或输入法自动记忆)一点意义也没有,反而只能起干扰作用。也如此,我以前也说过,速度本身并不太重要(只要别太慢就行了),关键是灵活安排文字的能力,或说是在这个基础上再强调速度。

还是那意思:即用搜狗类的输入法打字,只能打类似聊天性质的文字,如咱们现在打的,就是聊天么。你可以说“我没那种行文习惯”,但你没有,他(也是用纯拼音的)也不会有,再来个用纯拼音的他也不会有,因为他们没法有,他们只能被迫着打那种“纯拼音风格的文字”,而不能真正做到“言必己出”。久而久之,当你觉得用纯拼音输入法很舒服时,正如我说的,你被那种输入法同化了,只能打水花花的文字了。现在的网络写手为什么普遍水平差,就是因为他们绝大多数是用纯拼音输入法打的,而且因为“有个大体意思就行”、“大差不差就行”这种思维导致,他们别的方面也是很不严谨,比如说标点用得也非常乱,这就是输入法对思维方式的影响的另外一种表现。


还有,你说的那个“达到这个‘境’的人很少”,也是个事实,正如我以前说过,现在是输入法的儿童时代,即现在主流的输入法是玩具输入法,毕竟输入法的作用还没深入展开,用输入法的多也是就玩儿。也正因为如此,有的老作家至今没“换笔”吧,因为他们觉得再学个输入法又不想学(年纪大了,也有可能没遇到适合的输入法),用纯拼音输入法又不能写作。
回复 支持 反对

使用道具 举报

发表于 2009-8-22 20:19:37 | 显示全部楼层
我估计化外愚民你比我年长,那我就叫愚民先生吧。

如你所说,你的那些词可能只用一次,所以存为一个词语并不是什么好事情。而因为不是什么词组,打起来的确会有一些麻烦。

拼音输入法在这方面的确是有它的缺憾,没法弥补。

但是另外一方面,如果说现在的输入法还处在儿童时代,我可以同意;如果把现在的输入法,尤其某种输入法直接说成玩具,我不敢苟同;我也仍旧拒绝以使用了某些东西,来判定“境”和文章的好坏,以及人的思维。

我不是什么聪明人,也并非什么爱书如命,但似乎书多多少少还是比大多数人看过的多一些。

如果如下的论证真的逻辑上或者说法上是有问题的,大家权当是个笑料吧。

容我先说一个小的引子。
国内有一个挺不错的吉他手,他曾经和一个世界知名的吉他手(Paul Gilbert)切磋过技艺,后来谈起感受来他说不是Paul 能*的他*不了,但是大师*起来的感染力完全不一样。

这种差别可以算境的差别吧。

上次发帖的时候我没有去讨论什么是好东西,也没去谈什么是作家,那是因为觉得这个问题说起来有些烦,而上一个帖子,主体还是在呈现一个输入法的输入表现。

你所说的那些个叫网络文学的东西,即便那些作者不是用拼音输入法,他们的东西还是不会有什么改变。他们已经是“言已己出”了,他们“己出”的水平不到罢了。

那些个不用电脑的作家,是不是用了某种输入法一段时间,就再也写不出什么好东西了。那些写毛笔字写得很好的人,是不是写钢笔字会是丑的?
那些个乱用词语、乱用标点、乱用汉字的人,如果他们从一开始就真的有一款让他们想什么就能输出什么的输入法,他们就能说他们写的东西不是狗屎了?

一个班的人一起画画,大家都是用同样的笔,同样的纸,还规定了只能使用老师教过的技巧,这些技巧假定大家都会,你可以想象最后画出的东西的结果吗?

大家都有匠气了,工具也都有了,可是有的人明显缺乏才气。

那说说才气。

钱钟书,很有才气了吧,如果你只看他的东西,也觉得挺好了,语言之中透露的才气叫很多人暗地里自卑,但是如果有比较,你会发现这种才气掩盖不了他的轻浮和思考上与其他一些很杰出的作家的差距。我不去说《写在人生边上》,也不去说《围城》,就说在课本上大家都看过的《读〈伊索寓言〉》,这篇文章里你也可以看到他咄咄逼人的才气,你却看不到他在论证的时候的逻辑。

或许我这样评论钱钟书有人觉得我太狂妄,但在我看的书比较下来,真的是这个结果。

即便用拼音,就算只能打简单的东西。你也没法去判定这个人如何,这个人写的东西如何。

什么叫水花花的文字?不是如你所举的例子,用的词很妙,用的修辞很漂亮,组合起来就一定是好东西了。
如果你曾留意,你会发现很多巨著之中,在字词的使用上简单到不能再简单,但是这些字词连到一起之后,流光溢彩。
当然,我并非说有了好的词,有了好的修辞,就一定不是好的。语言是很难解构的。

我更愿意说一些文章是有重量的,这些文章并非一定靠什么特别的东西才可以承担这种重量。再漂亮的袋子,都可能装着沙子;再简陋的袋子,都可能藏着黄金。失去了这种重量,一篇文章最多可以叫美文或者用语范例,谈不上其他。

作家和好东西如何判定呢?
匠气,才气,思考?
回复 支持 反对

使用道具 举报

发表于 2009-8-24 09:30:26 | 显示全部楼层
针对要点答吧:
很奇怪你老是没明白我说的意思,本来挺简单的。

——你所说的那些个叫网络文学的东西,即便那些作者不是用拼音输入法,他们的东西还是不会有什么改变。他们已经是“言已己出”了,他们“己出”的水平不到罢了。
答:不仅仅是他们的水平问题,也肯定有输入法的问题,因为只要他们用了纯拼音输入法,他们就注定写不好,而且写作水平永远无法进步,不然太痛苦了。

——那些个不用电脑的作家,是不是用了某种输入法一段时间,就再也写不出什么好东西了。那些写毛笔字写得很好的人,是不是写钢笔字会是丑的?
那些个乱用词语、乱用标点、乱用汉字的人,如果他们从一开始就真的有一款让他们想什么就能输出什么的输入法,他们就能说他们写的东西不是狗屎了?

答:这道理本来是很简单的,按说你不应该再写这段的。不用电脑的作家,用了纯拼音输入法后,压根就没法写,而不是“就再也写不出好东西了”。这和毛笔字和钢笔字完全不同,因为后者牵扯不到单字的能力,相反后者还有增强,因为毕竟书写得更方便了。

——大家都有匠气了,工具也都有了,可是有的人明显缺乏才气。

答:纯拼音输入法的致命弱点就是让有才气的人无法发挥,单字能力好了则能发挥出来。道理和上段同。

——什么叫水花花的文字?不是如你所举的例子,用的词很妙,用的修辞很漂亮,组合起来就一定是好东西了。
如果你曾留意,你会发现很多巨著之中,在字词的使用上简单到不能再简单,但是这些字词连到一起之后,流光溢彩。

答:关键是自由度。而不是被迫。你说的“很多流光溢彩的巨著”,请说一下用拼音能轻松实现写的。
其实如果你的写作水平到了一定阶段,不用我说你也会明白的。
回复 支持 反对

使用道具 举报

发表于 2009-8-24 15:06:19 | 显示全部楼层
其实就是聊天,也时不时会出一些单字组合,只是几率少。至于很有水平的作品,没有一部是能用纯拼音输入法容易写的,因为这无关“修辞漂亮”或“朴素”的问题,而是在于打时能否自由安排文字的问题。在写作时,精力都集中构思上的,这构思不光有情节的大构思,也有遣词造句的小构思。拼音输入法更适合于打较为松散的句子,在某些特定场合下能行,但总的来说,它仍然很影响表达能力。其实就算再退一步,用纯拼音输入法能写某种特定风格的高水平文章,请想一下,什么人写东西都是一个风格,这个世界是不是太乏味了些,呵呵。

比如说刚才我聊天就聊到小陈同志,就对人道:“冠西么,自然就得冠过西门大人”。这个“冠西”(陈冠希的后两个字的谐音)及后边的“冠过”,都不是词,也不应该是词的。若拼音输入法的用者,在这场合后边肯定就会用词代替,前面的“冠西”甚至不打,甚至就连这样的句子都不打。这就是对思维的束缚。

这都是随机的,不能预期。在打字的过程中应将精力集中在要打的内容上,而不是让输入法扯着腿打,应该挺明白的道理啊。
回复 支持 反对

使用道具 举报

发表于 2009-8-27 09:28:47 | 显示全部楼层
拼音输入法容易造成人被拼音引导的问题可以说有,也可以说没有。

就我个人来说,可以完全说没有。
因为我的输入方式是这样的,现想好自己要输入的句子,如果这个句子中的单字比较多,我是先造词,再去字,然后组句。

举例,要输:“字之枝”,我是这么输的 "字体_之所以__枝干_"下划线表示退格。
字体 只需 输入 zt;之所以 只要输 zhsy;枝干 只需输 zhg

很繁吗?没觉得。思维连贯吗,个人觉得还行。
你把上面的输入方法当成由单字到词的所谓“真正输入法”的反向应用即可。

另外,考虑任何一篇现代文当中单字和词的比例,那种方法更应该是主流就清楚了。
回复 支持 反对

使用道具 举报

发表于 2009-8-27 11:24:37 | 显示全部楼层
——现想好自己要输入的句子,如果这个句子中的单字比较多,我是先造词,再去字,然后组句。

答:这样太麻烦了……应该是脑出意,指出字,之间没有滞涩。

还有就是我上面说的:有的本来就不应该是词,只是单字组合,而这样的单字组合是随时有可能出现的。
回复 支持 反对

使用道具 举报

发表于 2009-8-28 00:14:49 | 显示全部楼层
Post by 化外愚民;2019679
针对要点答吧:
很奇怪你老是没明白我说的意思,本来挺简单的。

——你所说的那些个叫网络文学的东西,即便那些作者不是用拼音输入法,他们的东西还是不会有什么改变。他们已经是“言已己出”了,他们“己出”的水平不到罢了。
答:不仅仅是他们的水平问题,也肯定有输入法的问题,因为只要他们用了纯拼音输入法,他们就注定写不好,而且写作水平永远无法进步,不然太痛苦了。

——那些个不用电脑的作家,是不是用了某种输入法一段时间,就再也写不出什么好东西了。那些写毛笔字写得很好的人,是不是写钢笔字会是丑的?
那些个乱用词语、乱用标点、乱用汉字的人,如果他们从一开始就真的有一款让他们想什么就能输出什么的输入法,他们就能说他们写的东西不是狗屎了?

答:这道理本来是很简单的,按说你不应该再写这段的。不用电脑的作家,用了纯拼音输入法后,压根就没法写,而不是“就再也写不出好东西了”。这和毛笔字和钢笔字完全不同,因为后者牵扯不到单字的能力,相反后者还有增强,因为毕竟书写得更方便了。

——大家都有匠气了,工具也都有了,可是有的人明显缺乏才气。

答:纯拼音输入法的致命弱点就是让有才气的人无法发挥,单字能力好了则能发挥出来。道理和上段同。

——什么叫水花花的文字?不是如你所举的例子,用的词很妙,用的修辞很漂亮,组合起来就一定是好东西了。
如果你曾留意,你会发现很多巨著之中,在字词的使用上简单到不能再简单,但是这些字词连到一起之后,流光溢彩。

答:关键是自由度。而不是被迫。你说的“很多流光溢彩的巨著”,请说一下用拼音能轻松实现写的。
其实如果你的写作水平到了一定阶段,不用我说你也会明白的。


不太同意你的这些说法。
拼音是字的读音,拼音输入就相当于“读”给电脑听。
一篇正常的文章读给人听,别人应该是能听懂的,尽管每个字单独说的时候别人听不懂。

拼音输入法跟形和音形结合输入法的不同在于。后两种输入法把电脑当做工具“笔”。
而拼音输入相当于电脑就是你的第一个“听”众----一个速记员。

现在的拼音输入法不够好,它不是一个好听众,时常会误解你的意思,确实会造成“说”的中断,停下来解释。但是随着算法的提高,这个听众肯定最后会做到接近完全听懂的--事实上现在的搜狗输入和google输入法已经能听“懂”很多了。

而如果电脑能够听懂你的话之后这整个写作过程对作者来说就变成一个“说”的过程,
难道好著作不能“说”出来,只能“写”出来吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表