これがベトナム大学院の実態だ!

Trường Đại Học Bách Khoa Thành Phố Hồ Chí Minhの大学院修士課程に社会人入学

作文対策

Tôi nghĩ rằng cho phát hiện của vấn đề nghiên cứu có 2 sau.
Thứ nhất là cần thiết của cuộc sống và tùy theo nguyện vọng của mình. Cụ thể, khi người ta nghĩ khó khăn trong trường hợp nói với người nước ngoài, thì có thể nghi thiết yếu máy dịch. Đặc biệt, nếu người ta có nguyện vọng sáng tạo của máy dịch, thi có thể lam biếc rất nhanh.
Thứ hai là nói với người nghiên cứu khác. Trong khi nhiều cuộc hội đảng, có thể xảy ra nhiều ý kiến rất tốt. Nếu nhà nghiên cứu lam biếc một mình, ta có thể giới hạn. Vì vậy, nhiều người nghiên cứu làm việc với người nhiên cứu khác.

Phương pháp nghiên cứu khoa học nâng caoが1年越しに開講!

2017年12月に科目登録したPhương pháp nghiên cứu khoa học nâng caoが、2018年10月になりやっと開講した!
受講生の中には1年前初めて本学の授業を受けた時からの顔見知りである学級委員長もいた。
逆に言うと、それ以外の顔見知りは3名ぐらいで、それ以外は知らない顔であった。

科目概要
科目名:Phương pháp nghiên cứu khoa học nâng cao
区分:必修科目(研究コースの学生のみ)
単位数:3単位
授業料:1,860,000ドン(約9,000円)※2017年12月に支払い済み
1回の授業時間:4時間
回数:6回
期間:2018年10月~11月
成績評価:
 プレゼンテーションや作文など40%
 レポート60%

試験が存在しないので単位取得の可能性が高いとは思うが、レポートの具体的なテーマがまだ公表されていないので十分に気をつけたい。
いづれにしろ必修なので意地でも取得したい。
また、1回の授業時間が4時間と長丁場。こんな授業は他にない。
一応休憩が2回取られるが、1回目の休憩でかなりの人数がリュックを背負って教室を出て行った。
それを見計らったかのように休憩後に小テスト的な作文を課された。自分のノートを1ページ切り取って名前と作文を書き先生に提出。
これが上記の40%に含まれるのだから、休憩時間に帰らなかった学生へのボーナスだ。

今回の作文のテーマはこれ
Theo hiểu biết của học viên thì tại sao nghiên cứu khoa học có các đặc điểm sau:
Tính mới
Tính tin cậy
Tính thông tin
Tính khách quan
Tính kế thừa
Tính cá nhân
Tính rủi ro

そう、配布資料が全部ベトナム語なのだ。
新聞などが読めるレベルのベトナム語力があるといい。
むしろ、そのぐらいないとアサインが理解できない。
そういうとかなり難しい科目なのかと思うが、実はそうでもない。
これはベトナム語の特性だが、文字から意味を理解することや、文字を書くことはそんなに難しくない。
上記のテーマも、「学生の理解に基づき、なぜ研究科学に以下の特徴があるか?(を書け)」とわかる。
これを「ておひょーびえくーほっびんてぃーたいさおぎんきゅうほーほっこーかっだっでんそー」と発音することもできる。
しかし、それを聞いてベトナム人に理解させられる日本人は200人に1人ぐらいしかいない。
つまりベトナム語は文字の読み書きは小学校レベルだが、発音をしようとすると司法試験レベルになる。
文字の読み書きはできても発音が不明という意味ではヘブライ語ラテン語ベトナム語の意外な共通点である。
面白いのが日本語を勉強しているベトナム人が真逆であるということ。
会話などが結構できるのでビビるが、実は新聞を読めない。
日本人がシンチャオの発音すらできないのにベトナム語の新聞を読んで理解できるのとは正反対である。
したがって、プレゼンテーションなどで学生が声を発する必要がある場合は英語で行うとスムーズである。

なお、資料から、次回の作文のテーマが明らかになっているので対策をしておくとよい。
テーマ:Theo hiểu biết của học viên thì “vấn đề” nghiên cứu được phát hiện bằng cách nào?

Nhận dạng mẫu và học máy 3回目でまさかの教授死亡によるご冥福をお祈り

9月22日(土)、この日はNhận dạng mẫu và học máy 3回目だったが、授業開始から20分を過ぎても教授が現れない。
この時教室にはすでに10名以上がいた。
不審に思った学級委員っぽい人が電話をかけ、何か話していた。
詳しいことはわからなかったが、少なくともその日の授業がないことが分かり、全員教室を出て帰宅する羽目になった。
この日○終わり 悲しきかな。
ご冥福をお祈りします。
ありがとう。君を忘れない。

9月29日(土)、死んだ人が生き返ったような話だが、授業が行われた。
前回がなかったので今回が3回目となる。
この日の授業終了後、角刈り君よりexciseが配られた。
これはいわゆる宿題のように提出義務があるものではないが、10月末に行われるであろう中間試験に同じ問題が出るようだ。

さて、このexciseをはじめ授業の内容を理解するにはMATLABなるソフトが必要。
しかしこのMATLAB、日本円で30万円以上する。
一応、MATLAB crackでぐぐるとそれらしいベトナム語のサイトが出る。
しかし今回は無料の類似品を使うことにした。
何も、こんな匿名の場所で割れはよくないなどときれいごとを言うつもりはない。
どちらかというと割れによるウイルスまではいかないにしても、スパイウェアのような地味な弊害がきになった。
そこで、FreeMatなる無料ソフトを使ってみた。
MATLABと同目的の無料ソフトは何種類かあるが、FreeMatが一番容量が小さく、ダウンロードやインストールが早いためだ。
これを使うと30分以上かかる共分散行列の計算が1秒以内に終わる。
同様に固有値逆行列も短時間で簡単にできる。

乳幼児の学校訪問(Gymboree)

今回から新設したカテゴリ。特に大学にとどまらず、学校や教育全般についての話題に使うことにする。
さて表題の件だが、小さい子供を対象にした遊び場兼学校のようなものを妻が見つけてきたので3名で訪問。
莫大な金がかかるが初回無料だそうだ。
実際終了後に料金表を見たら1か月で大学院の年間授業料に相当していた。家賃より安い程度。

場所は31 Nguyễn Thị Minh Khai, Bến Nghé, Quận 1, Hồ Chí Minhで、Googole MapではAeon Citimartと表示されているところだ。
ストリートビューでは怪しげな漢字の銀行が表示されているが、実際は喫茶店になっている。
この喫茶店の前が駐車場だ。
で、入って階段を上がるとGymboreeというのがあり、靴を脱ぎ、かつ靴下の着用が義務図けられる。当然そんなことわかるわけがないので持ってないが、市場より安い値段で新品を売ってくれる。
一応予約制で、予約した時間の10分前に集合といわれていたようなので焦ったが、実際には予定時刻を過ぎても開始しない。
その割に全員手の消毒や体温チェックが行われるという緩いのか厳しいのかわからない。
初回体験だからなのかそれとも予約した人が逃げたのかわからないが結局貸し切りとなった。

内容としては日本で地区の公民館で行われる親の集まり(一応母親と新生児の集まりとうたっているが、父親が行っても追い返されるどころか主催者に普通に受け入れられる)とほぼ変わらない。
しかも子供1名につき親1名しか部屋に入れない。片親ならともかく一般的な家庭ではどっちかの親は部屋の外でガラス越しに指をくわえてみているだけだ。
その時はまだ値段がわからなかったが、終わってみて料金表を見たところコストパフォーマンスはないとの結論に達した。
次の時間帯には親子3~4組ほどが入室していったが、いずれもベトナム人であった。
一応英語での教育ということで外国人向けをうたっていたが、そうでないことが分かった。
なお、日本人の姿は他に見られなかった。

さて、場所がNguyễn Thị Minh Khaiだから相当貧乏くさいんじゃないかと不安に思う人も多いが、意外や意外。
実は当初Gymboreeの場所があまりにもわかりにくかったため児童施設的な部屋に向かっていた。
そこにいた日本人の子供が、「こんにちは!」と館内に響き渡る大きな声であいさつをした。
こちらもうれしくなり、同じように館内に響き渡る大きな声で「こんにちは!」と返したのは言うまでもない。
これまでの数年間、ハノイでもホーチミンでもこのような元気な子供はいなかった。
レタントンとかの日本食レストランで何が嫌かって、陰気くさい日本人の子供や家族連れがいること。
せっかく高い日本料理やに来ているのに全然うれしそうじゃない。
まるで世界の終わりかのような暗い表情でボソボソ話す。飯がまずくなる。
これは子供だけのせいじゃなくて、母親が日本人なのだがそいつがまた暗い。
そんな数年間を過ごしてきたので、このように明るい日本人の子供の存在は極めて珍しい。
この子供たちは1回のイオンマート付近で鬼ごっこをしていた。
最近は任天堂ナントカなどのゲームで遊ぶ子供ばかりだったので、ましてベトナムでこのような遊びをする子供は極めてレアである。
この日はあいにくの大雨であったが、晴れた日は公園で鬼ごっこだろう。

が、一転して大人が暗いのが残念であった。
子供向けの施設もイオンマートもあり活気にみなぎっている我々夫婦とは対照的に、ここに住んでいると思しき日本人の大人が暗い。
妻によるとイオンマートの上がホテルになっているらしい。
ベトナムの場合ホテルと住居の境界線があまり明確でないので、いわゆる長期滞在を前提としたアパート的なホテルかもしれない。
いずれにしろ日本人が暗すぎて絶対に住みたくないオーラが出ていたのでどちらでも大勢に影響はないが。
子供が鬼ごっこをしているので当然両親もいると思ったが、なぜか日本人の大人は男性ばかり。
母親はどこに行ったのか?
子供が元気なだけに、大人が元気がないことと、母親不在にとてつもない違和感を感じた。

余談だが、このGymboreeに行ったという日本人がいたようだ。
合わせ、連想ゲーム風に学校の写真もあったが当方のサーバに画像を置くとパクリになってしまうので直リンで。
https://instagram.fdad3-2.fna.fbcdn.net/vp/461c7501623c702c640d042e2e7d30b7/5C2F8200/t51.2885-15/e35/30589862_166431810729580_2501854695149010944_n.jpg
https://instagram.fdad3-2.fna.fbcdn.net/vp/f17c459167466937225cb09c0903656d/5C2F2746/t51.2885-15/e35/21149150_1511161102275753_6989373492516880384_n.jpg
https://instagram.fdad3-2.fna.fbcdn.net/vp/45b2d9920ace0c6b90fe807ba0dab39b/5C2B85DA/t51.2885-15/e35/15034691_1643240839308109_7810047811847716864_n.jpg
https://instagram.fdad3-2.fna.fbcdn.net/vp/b2e721f9b7a7f1f58006defccb7a83a1/5BA3CB61/t51.2885-15/e15/40820584_253116155545766_9006240747944763030_n.jpg
https://instagram.fsgn5-7.fna.fbcdn.net/vp/0cbf595e196fd06de90cb664e925445c/5C287250/t51.2885-15/e35/39040059_1027663397398087_9112853569026916352_n.jpg
説明上必要な場合を除き基本的には画像はアップロードしない。
これはサーバの負荷軽減ということよりも、往年のテキストサイト的なスタイルをリスペクトしていることの方が大きい。
はてな匿名ブログにテーマの専門性・一貫性がついたものと思ってもらってもいいだろう。
アメーバブログなどで誰も必要としない食べ物の写真ばかりをアップロードしてサーバ管理者、読者双方に迷惑をかけているブログとは対極にあるといえる。
これは不思議なのだが、なぜかそういうレベルの低いブログは5文字ぐらいで改行したり、さらに改行ごとに空行を入れるという文体レベルでの読みにくさが散見される。
VBやC、Javaの初心者がエンターを押しすぎて無駄に空行が入ってしまうことがあるかもしれないが、改行ごとに空行を入れるというのは相当意図的にやらないとまずできない。

またこれも不思議なことに、アメーバユーザにそういうデジタル文盲が多く、はてなライブドア、FC2等のユーザはデジタルリテラシーが高い傾向がある。
仕事でVBやC、Java等のソースを書いたりするので、空行やコメントがありすぎると逆にないのと同じになるという現象を先輩から教えられるからなのだろうか。
VBあたりだと改行していい場所も文法上決まってることもあるし。
そういう意味で、まだブログというものがなく、ネット上で自分から情報を発信する場合はHTMLを作ってFTPでアップする時代は無駄な改行や空行を入れるという人はいなかったように思う。
また、HTMLやFTPの知識がない人でも掲示板などで自分の意見はかけたが、基本的には文字の大きさや色をを変えたりはできなかったので、内容そのものが他人に不快感を与えるものでない限り問題になることはなかった。
ただ、SNSなどの普及により専門的な知識を必要とせずに情報発信できるようになったのは便利と思われたのはほんの一瞬で、実際には免許も登録も必要なく車を公道で運転できるようになったのと変わらない危険な事態となってしまった。
インターネットの利用は車の運転と違って免許や資格は必要ない。
免許がいらないからこそルールやマナーを知ってから利用、まして情報発信をしようと考えるのがはてなライブドア、FC2等のユーザということなのだろう。

Nhận dạng mẫu và học máy 2回目

9月15日(土)、Nhận dạng mẫu và học máy 2回目が行われた。

【範囲】
Appendix A 全部
Chapter 2 Pattern Representation P16~P33およびP72~P76

2回目ということもあり、授業の進め方がだいぶわかってきた。
ある回でA、B、Cの3つの概念を説明したら、次のDという概念の紹介だけをしてその回は終了。
次回はD、E、Fの3つの概念を説明し、Gを軽く説明、とい具合である。
このため今回やった個所と次回どこから始まるかが明確である。
当科目の担当教官は必修科目Phân tích thiết kế giải thuậtの担当もしているので、その科目も同じ進め方かもしれない。
さて、授業中に資料の重要単語をベトナム語で板書していたのでメモしておく。
ma trận đơn vị 単位行列
khoảng cách biên tập / Edit distance
chuỗi số thực 一連の数式
xoắn thời gian động 動的時間ねじれ
trích yếu 摘要
vứt trích 抜粋
bài toán trị riêng 固有値問題
thu gọn dữ liệu データ簡略化
phân tích biệt thự tuyến tính 線形判別分析

休憩中、昨年度の科目で同じチームを組んだ人と話したが、同科目は数学的な内容で難しいとのことだった。
また帰り際に角刈り君とも話したが、やはり内容は難しいそうだ。さらにこの後appendix Cやexerciseが、そして中間試験後にはmini projectの問題文が送られてくるとのことだった。

Nhận dạng mẫu và học máy - Pattern Representation攻略2

Mahalanobis distanceの公式
\displaystyle D_M(X) = \sqrt{{(X - μ)}^{T}{\sum}^{-1}(X - μ)}
なにやら記号がたくさん出てくるが、T乗が付く値は問題文で与えられる。横のみの行列である。
T乗がない方が縦のみの行列。
また、Σのマイナス1乗は逆行列というやつで、資料では何の解説もないが、ググると出てくる。
なお、行列は()でくくるが、wikipediaの英語版やベトナム語版を見るとでくくっている。
厳密な数学記号としてはどちらも同じもののようだ。
配布資料が英語およびベトナム語に準拠しているので、このブログでも
表記をしたかったが、はてなブログで行列を表示する場合は()でくくるしかないようだ。

余談だが最近では高校で理系であっても数学Cがなく、そのため行列もなくなったと聞く。
大学ではあるのかもしれないが、そもそも大学で数学を専門にやらない人の方が多いし、やったとしても大学の授業なんて昨日見た夢のようなもの、いちいち覚えている人は皆無だろう。
そういう意味では今の20代ぐらいの人は大学院でコンピュータを学ぶことに大きなハンデがある。
というか、まさかコンピュータを専門に学ぶにあたり数学の行列の知識が要求されることの方が驚愕である。

さて、Mahalanobis distanceの例がこちら。
以下の共分散行列が与えられる。
\displaystyle \sum  = \begin{pmatrix} 1.1&0.3 \\ 0.3&1.9 \end{pmatrix}
ベクトルはそれぞれ以下の通り。
\displaystyle μ_1 = {(0, 0)}^T, μ_2 = {(3, 3)}^T, X = {(1.0, 2,2)}^T,

と、ここまで書いて数式を書くのに疲れてしまった。
ちょうどここから先は以前書いた内容にエクセルのスナップがあるのでこちらを参照。
k4h8.hatenablog.com

Nhận dạng mẫu và học máy - Pattern Representation攻略1

同科目は
Chapter 1 Overview on Pattern Recognition and Machine Learning
Chapter 2 Pattern Representation
Chapter 3 Nearest neighbor based classifiers
などの資料があり、現在6章まで提供されている。
最終的にはこの倍の12章ぐらいまでになると予想される。
なお、Chapter 1は全体の紹介で計算などはない。
そこで、Chapter 2 Pattern Representationの攻略を行いたい。

Distance measureにおけるMinkowski metricと呼ばれる公式
\displaystyle d^{m}(X,Y) = \left( \sum_{k=1}^{d} {|x_k - y_k|}^{m}\right)^\frac{1}{m}
しかし、この公式そのものを使うのではなく、実際に利用されるのはm=2の場合でEuclidean distanceと呼び、このように簡略化される。
\displaystyle d^{2}(X,Y) = \sqrt{{(x_1 - y_1)}^{2} + {(x_2 - y_2)}^{2} + \cdots + {(x_d - y_d)}^{2}}

例:X = (4, 1, 3) and Y = (2, 5, 1)のときEuclidean distanceは
\displaystyle d^{2}(X,Y) = \sqrt{{(4-2)}^{2} + {(1-5)}^{2} + {(3-1)}^{2}} = \sqrt{{2}^{2} + {(-4)}^{2} + {2}^{2}} = \sqrt{4+16+4} = \sqrt{24} \fallingdotseq 4.9