これがベトナム大学院の実態だ!

Trường Đại Học Bách Khoa Thành Phố Hồ Chí Minhの大学院修士課程に社会人入学

Xử lý ngôn ngữ tự nhiên別な宿題が!

前回のエントリにて、宿題の内容を書いたが、昨夜になってメールが来た。
なんと、宿題の問題は別であったというのだ。

1. Hand simulate the Viterbi algorithm using the data and probability estimates in Figures7.4- 7.6 on the sentence Flower flowers like flowers. Draw transition network as in Figure 7.10-7.12 for the problem, and identify what part of speech the algorithm identifies for each word.
文章「Flower flowers like flowers」の図7.4〜7.6のデータと確率の推定値を使用してビタビアルゴリズムを手でシミュレートします。問題について図7.10-7.12のように遷移ネットワークを描き、アルゴリズムが各単語についてどの品詞を識別するかを識別します。

Flower flowers like flowers
N V P N

2. Using the bigram and lexical generation probabilities given in this chapter, calculate the word probabilities using the forward algorithm for the sentence The a flies like flower (involving a very rare use of the word a as a noun, as in the a flies, the b flies, and so on). Remember to use 0.0001 as a probability for any bigram not in the table. Are the results you get reasonable? If not, what is the problem and how might it be fixed?
この章で与えられているバイグラムおよび語彙生成確率を使用して、文「The a flies like flower」の順方向アルゴリズムを使用して単語確率を計算します(a flies、b fliesなどのように、aという単語を名詞として使用することはめったにありません)。表にないバイグラムの確率として0.0001を使用することを忘れないでください。 あなたは合理的な結果を得ましたか? そうでない場合、問題は何ですか、そしてどのようにそれは修正されるかもしれませんか。

The a flies like flower
ART N N V N

さすがに昨日の今日だし、締め切りはメールが来てから1週間後と解釈するのが正しいだろう。
それとともに、前回の授業が尻切れトンボで終わってしまったこともあってか、宿題の答えも送られてきた。
つまり前回休んだ要領よしお君、正解。
前回の宿題の答えも、次回までにすべき宿題の問題文もすべてネットで手に入ったのだ。
なんだかそれこそ未来を見通す力があるみたいだ。
なにせ前回の授業は休んでも良かったのだから。
一応メリットとしては板書した人には板書点が与えられたことか。
つまり、前回の授業では板書しなかった人は来た意味がなかったということになる。
そういうこともあるので、板書は積極的に行いたい。
逆に、板書の時に動けさえすれば、後の時間は授業を抜け出してトイレに行こうが食事に行こうがベンチで寝てようがかまわない。
むしろ力を入れるべき時に一生懸命になり、力を抜いてもいい時には充電を行おう。

なお、次の次の授業の時間を利用して中間試験が行われる。