自然言語処理における、口語の誤文の有用性について

 自然言語処理について特に詳しいわけではないが、会話上における誤文には面白いものがいくつかあり、これがコンピューターによる自然言語処理に活かせそうな気がする。

「所詮お前は勉強ができない」

所詮は本来の用法として現在から未来に向かって避けられない(悪い意味での)結末があることを示したり、あるいは何か先進的ななにかがあるようで本質的には大したことがないといった用法で使われるが、悪いニュアンスを示す副詞としてのみ使っている。誤まっていると言うほどではないが、文中では違和感がある言葉だと思う。こういったものをうまく噛ませられないかなぁとか思いつつ、そもそも会話中でないと現れないような誤文のデータを集めるのも大変だなぁとおもったり