伝え聞く深層学習的なやつって結局のところ事例をひたすら叩き込むことで対応しているんだと思うけど、そういう門前の小僧式の学習は人間でも難しいと思うんよ。
乱暴だけど殴られて覚えるような丁稚奉公式とか、叱られたり褒められたりしながら学習する生徒式みたいな、教え導くような枠組みが必要なんじゃなかろうか。
もちろん今でも学習を評価する仕組みってのはあるんだろうけど、自分が学習して自分で評価してっていう強化学習は、要するに自学自習なわけで。人間でも自学自習で変な風になることもあるしなぁ。
Alpha GOのときに複数のインスタンスで勝負をし続けて学習し合うって話もあったけど、要するに門前の小僧が仲間内で勉強し合うみたいな感じで、Alpha GOは一定のルール下での話だったから良かったんだろうけど、ルールがない分野へ応用したらそりゃ歪んでいくよなぁっと。
ってなことを考えていたら、学習している存在とは別に存在する教師(教師データという意味ではなく)が方向性をコントロールするような教え導くようなことが必要な気がしたりしなかったり。でも、それを自動化するためには教師の教師の教師の教師のそのまた教師が…。
その点、ゲームなんかではいい感じなのはルールっていう絶対の教師がいるのでそれを逸脱できないってのが聞いてるんだろうなぁ。
ってなるので世の中って難しいなぁって思うのと同時に人間良くできてんなっと思う。教育ってすげーな