Kentaro Kuribayashi's blog

Software Engineering, Management, Books, and Daily Journal.

2020年7月22日

論文読み会、先日はわりと頭がクリアで理解できたーと思ってたけど、今日はあんまりよくわからなくて気のせいだった……。しかし、みんなで議論する中でじょじょに理解が進んだのでありがたい。

午後からのBIT VALLEY 2020のキックオフイベントの準備などした後、本番。主催4社のCTOによるトークセッションのモデレーションを仰せつかったのであった。オンラインで難しいところもあったが、そつなくこなせたのではないか(もっとぶっこみたかった気持ちはあるが)。その後はミーティングなど。

夜はCTO協会の定例ミーティングをした後、夕食を作って食べる。ずっと座りっぱなしだったので、自転車でしばしうろうろする。ちょっとした坂道でも太ももが痛くなってくる。坂道を走り回って回復させたい。というか、マンションの非常階段を上り下りするう運動をしようと思ってまだやってないのだった。それが運動という意味では一番公立がいいだろうから、やらねば(自転車や散歩はそれはそれで好きなのだが)。

最短コースでわかる ディープラーニングの数学』の続きを読んでいたのだが、疲れてきたのでやめて、レポートを書く。これで終わりかと思っていたので少しおいてあったのだが、明日からの4連休にびっしりつまった授業でもレポートが何本あるのかわからないぐらい出されることが予告されており、抱えているものをさっさと放出しないとヤバいなと思ってやりはじめた。書けば1時間ほどでできはするので、やりさえすれば早いのだが。そんなわけで提出。頭が疲れた。

先週、頭痛でしんどかったせいもあっていろいろリズムが乱れまくってしまったので、来週からは取り戻していきたい。

2020年7月21日

朝からいろいろ話したりなどしていて、夜になったらめちゃ疲れて眠くなったので2時間近く仮眠。深く眠った気もするしそうでもない気もするし、という感じ。Kが買ってきた鰻や鰹のたたきなどで、豪華な夕食。その後、アイスも食べる。最近、すっかりお酒を飲まなくなったのはいいのだが、アイスをしょっちゅう食べてるのであった。

その後、研究ネタをまとめたり、論文を一本読んだのについて感想をメモしたりなど。その後、『最短コースでわかる ディープラーニングの数学』をベッドでごろごろしながら読む。この本を、最近数日寝入りばなに読んでいるのだが、説明がわかりやすくてすごいなあ。このあたりの、機械学習がわかるための数学みたいな本、いろいろな方法でわかりやすさを追求している。

2020年7月20日

先週は研究所が忙しくて論文読み会がお休みだったが、今日から再開。なんか今日は朝から頭が働いていて、比較的スラスラと頭に入ってきた気がする。単に感嘆な内容だっただけかもしれないが。自分の研究にもあれこれ活かせそうで良い感じ。その後、開発案件の打ち合わせや定例ミーティングなど。

夜は冷蔵庫の残り物で麻婆豆腐・茄子(豆腐も茄子も入れた)を作る。やや水っぽくなってしまったのだが、味はいい感じ。からいのは苦手なのだが、やっぱりある程度はスパイスを入れたい気持ちにはなるなあ。その後、『ゼロから作るDeep Learning ❷ ―自然言語処理編』を読み始める。めちゃくちゃわかりやすいし、やってることの意義もちゃんと説明してくれていて、確かにこれはいい本だなあと思う。

先日ブログに書いたJAIST入学記について、ブログにかかれている内容だとJAISTだけじゃなくて他の選択肢もあるのではないかという指摘をいただいたので、書き漏らしていた前提条件についても明記した。あとは、研究所サイトの自分のプロフィールを少し手直ししたり、データセットの匿名化加工についてちょっと調べたりなど。

北陸先端科学技術大学院大学先端科学技術研究科博士前期課程に入学しました

タイトルの通り、長い名前の大学院(以下、略称のJAISTを用いる)に社会人学生として入学しました。といっても、実際に入学したのは今年(2020年)の4月なのでしばらく時間が経っているのですが、ブログに書いてなかったのを思い出して、いまこうして書いているわけです。

JAISTは、本校は石川県の能美市にあるのですが、品川に東京サテライトがあり、わたくしはそこの所属ということになります。研究面では、篠田陽一先生に主研究の指導を仰ぐことになりました(といっても、まずは所定の単位を取得することが先決ではありますが)。

ただ、新型コロナウィルスのこともあり、授業もゼミもオンラインであるため、入学してからは一度もキャンパスに出向いておらず、誰ともお会いできていない状態です(追記: この記事を書いた翌日に、ゼミへの参加のために初めて品川の東京サテライトへ出向くことができました)。

なぜ社会人学生になったのか

わたくしのキャリアについてはホームページにあれこれ書いていますが、ひとことでいうと1999年に法学部政治学科を出た後にいろいろあってインターネットサービスのエンジニアになり、12年ぐらいこの業界でやってきました。そんなわけで、少なくとも部分的にはそれなりに勉強したとは思いますが、情報科学について専門的な訓練を受けたわけではありません。

そのままやっていくというのも可能ではあったのでしょうけれども、最近は研究所の所長などもやっていて、そのような立場として自分自身が学位を取る必要があると考えたのが、進学を決めた一番大きな要因です。研究所もメンバーが増えてこの先ますます専門化していく中で、研究所のディレクションや研究員との協働をより高いレベルで行っていくには、自分自身もその道でなにかしらの達成はしておくべきだろうということです。

わたくしの所属するペパボ研究所では「なめらかなシステム」というコンセプトを大枠に基づき、各自がそれぞれ研究活動を進めています。研究員の奮励努力により研究開発成果のレベルも年々上がっています。そんな中で、わたくしがアカデミックな達成やアウトプットがない状況では、大まかな方向性をディレクションすることはできても、もっと具体的なところで適切なレベルで協働することは難しいと感じてきました。

ざっくりそういうわけで、自分自身もチャレンジしてみることにしたわけです。

なぜJAISTで博士前期課程なのか

まず、先述の通り、わたくしは1999年に法学部政治学科を卒業した、文系学士です。その後いろいろ経験した後、大学院では勉強をしたいというよりは、自分の研究をひと通りやってみたいという気持ちがあります。なので出願資格を通して博士後期課程に行くという道もありえたわけですが、それは止して博士前期課程から行くことにしました。

そもそも、研究に関する実績が不足していること、博士後期課程で取り組むにふさわしい研究計画がまだ作り上げられてなかったこと、出願資格の日程的な問題でもし通ったとしても入学が1年遅れることになること等の理由がありました。また、博士後期課程は正直やりきれるかわからないので、まず博士前期課程を確実に終了して修士の学位を取るのが、なにかしら形に残る可能性が高いと判断したということもあります。

JAISTを選んだ理由ですが、まずは形式的な要件として、以下の条件を満たすことを前提としました。

  1. 社会人学生としての入学なので、可能な限り土日に授業を受けられること
  2. 情報科学に関する研究を、博士後期課程への進学を視野に入れた上で行いたい(修論指導できる体制と博士後期課程もあることが必要)
  3. 通学場所は、時間的な関係でできるだけ東京都心に近い方が望ましい
  4. できれば学費が相対的に安い国立・公立が望ましい

その前提で考えた時に、いろいろ調べた結果、実質的に東京においてはJAISTしか選択肢がないように思えました(私立だともうちょっと選択肢はあるのかもしれませんが)。その要件を満たす学校は他にもあるかもしれませんが、見つけられませんでした。

選んだ理由のうちの内容的な要件については、ホームページで先生方や研究テーマを眺めてみたところ、情報科学に関する様々な分野への取り組みや実績が豊富で、ここならだいじょうぶだろうと思えました。また、これが一番大きかったのですが、知人やインターネットで知っている人々にJAIST出身者が多くいたこともあります。特に@hirolovesbeerさんには研究室もご紹介いただいたり等、大変お世話になりました。

JAISTへの入学に至る経緯

ここ数年、先述の理由により、情報科学に関する学位取得へチャレンジしないとなあと思ってはいたのですが、いろいろ些事にかまけて取り組めずにいたところ、昨年(2019年)の11月頃になんとなく大学院について調べていたところ、興が乗ってきて「今度こそやろう!」という気持ちになり、その勢いで受験までいったというのが実のところです(ここ数年、秋頃になるとあれこれと大学院のことをおもむろに調べたりしていたということはありました)。

それで、JAISTの出願要項を調べて必要な書類をそろえ、簡単な研究計画のようなものを書いて、先述の@hirolovesbeerさんに相談してみました。そうしたところ、様々なアドバイスとともに研究室についてもご紹介いただき、ゼミにお邪魔する手はずまで整えていただきました。とりあえず出願だけは済ませておいて、ご紹介いただいた篠田先生にメールしたり、12月にゼミにうかがったりして、1月11日に試験を受けました。

受験は、出願時に提出した「本学入学後に取り組みたい研究課題について」という簡単な研究計画を述べた小論文について、3人の先生方の前で発表するというもので、以下のスライドを用いて行いました。

speakerdeck.com

(小論文とかあれこれの書いて提出したものを、自分としては公開してもいいのですが、出していいものかわからないのでスライドだけにとどめておきます)

このスライドで述べている内容も、だいぶぼんやりとしたものではあったので、あれこれと質問をいただいたのですが、あんまり研究内容そのものについての話にはならず、周辺的な内容が多かったように思います(「ほんとにこの研究をしたいと思っているのですか。何か他にやりたいことがあるのではないですか」とか「学部時代の得意科目として日本政治史があげられていますが、勉強したことについて短くまとめて答えてください」とか)。

(なぜそういう話になったかというと、エントリーシートのようなものに学部時代の得意科目を書く欄があったのですが、先述の通りわたくしは法学部政治学科卒なので、いま得意なことでいえば情報工学的な内容を書けますが、科目として受けたわけではないので学部時代のことを書くしかなかったわけです)

そんなわけで面接の手応えとしてはだいぶよくない感じで、だめだっただろうなあと思っていたのですが、2週間ほど後に合格通知をいただき、入学できることになったのでした。きちんと研究をして、「あのときのやつはちゃんとやってんだな」と思ってもらえるような成果を上げてご覧に入れたいと思っています。

研究テーマについて

上述のスライドの通り、入学を検討していた時期には、OSSによる生産性向上とセキュリティ担保の両立というテーマで研究をしようと思っていたのですが、入学後にあれこれ考えた後、ちょっと違うこともするかもしれないなあと思っています(もちろん、これはこれで強い関心があるので進めたいとは思っています)。

先述の通り、わたくしの所属するペパボ研究所では「なめらかなシステム」というコンセプトで研究を進めているわけですが、自分自身の大学院での研究も、もっと直接的にそのコンセプトに沿ったものにしたいなあと思い始めました。そこで、コンセプトを実現するに際しての研究所の具体的な主要テーマのひとつであるセキュリティ(具体的には昨年@monochromegane研究員や前述の@hirolovesbeerさんと共著した「なめらかなセキュリティ」に関すること)や、情報推薦あたりにも取り組みたいなあと考えているところです。

Webアプリケーションを取りまく、利用者、開発運用者、情報システムの間で行われるコミュニケーションをなめらかにするべく、自社のサービスで蓄積された行動ログによって分析・学習したモデルを用いて、サービスで課題となっているセキュリティ対策や情報推薦等に適用するみたいな内容にしようかなあとも考えたりしているところです(そもそもいろんな基礎知識が足りてないので、いま必死に勉強している状況です)。

JAISTへの入学を考えている人々へ

わたくしはつい数ヶ月前に入学したばかりなので、もしかしたらこれから挫折するかも知れないですし、そもそもまだ学校のこともよくわかっていないために、おすすめしたり助言したりするようなことはほとんどありません。しいていうなら、入試の面接は(少なくともわたくしの時は)ガッツリつっこまれたので、その心づもりで準備しておくほうがいいかもしれません。あとはまあ、JAISTは入るのは相対的に簡単なようですが、授業は普通に大変だし、(まだ取ってないのでわかりませんが)学位を取るのも大変なんだろうなあと思います。

それはともかくとして、冒頭に書いたとおり新型コロナウィルスの関係で、入学してからまだ一度も東京サテライトに出向いてないという状況で、授業もずっとオンラインです。そうなるといろいろとわからないことやイレギュラーなことがあったりするのですが、とはいえ周りに直接聞ける人もいません。しかし、有志によるSlackワークスペースが運営されており、そこでずいぶんといろんな人々に助けていただきました。オフラインの交流があっても、その有用性は減じないでしょう。これからはいる人々にとにかくいいたいのは、Slackワークスペースに必ず入りましょう!ということです。

おわりに

数ヶ月前に入学したばかりで、まだ研究テーマもはっきりとした輪郭ができたわけでもないので、いまはまだ前途多難な状況です。4学期制の1学期目が終わりそうな段階で、まだ1単位も確定していないので、勉学という意味でもどうなるかわかりません。そのため、この先どうなるかは全然わかりませんが、ともあれなんとか食らいついてまずは修士の学位取得を目指します。その後、心変わりしなければ博士後期課程にも進みたいと思っています。

43歳にもなって、いまはまだ何も達成していないわたくしです。そろそろ少しばかりでも何かしらを成したということを、ひとつぐらいはやってみたいと思って奮励努力するしかないという気持ちでいまはおります。

2020年7月19日

昼からJAISTの東京サテライトで行われるゼミに参加するために品川へ。入学後、初めて行くのであった(それまで、ゼミと入試で2回だけいったことがあっただけ)。ゼミでは、参加者それぞれの近況報告とか、研究内容の相談など。自分は、近況とともに情報推薦をやろうと思い始めていてみたいな話をしたら、突然よくわからんこといいだしたみたいな感じになったので、なんか形にして出さないとなあ。

ゼミの後は『自然言語処理〔改訂版〕 (放送大学教材)』を読む。先日まで受けていた授業の復習みたいな感じ。なんかもっとひとに説明できるぐらい身につけたいなあ。その後、渋谷の丸善ジュンク堂によって本を眺めたり。『最短コースでわかる ディープラーニングの数学』のKindle版を買う(もうこういう系はいいかなと思いつつ、寝る前のおともに)。次は買っておいてあるチャート式を読もうかなあ。特に、線形代数とか全然わからないし。なんか色々ほしい本はあるのだけど、どうにも研究の方に気持ちが引っ張られていて買う気にならず。

お惣菜をあれこれと買って帰宅し、夕食。食べた後、論文読み。先日読んだ『深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)』から拾った論文を読み始める。その本で参照されている論文も、できるだけ読んでいきたいものだ(140本あるけど……)。そういえば先日、いかにも強そうな研究者の国際カンファレンスまとめスライドみてたら数百本を読んでその会議での動向をいろんな切り口でまとめたりしていて、そもそも頭の作りがまったく違う……とげんなりしたのだった(自分などは頭のメモリに論文数本ものらない)。

めぼしい論文はMendelyにカテゴリごとにフォルダを作って放り込んであるのだが、あらめてそのカテゴリを観てみると、いろいろやりたいと思っていることがいっぱいあるなあと思ったり。そのどれもやっていきたいが、あれもこれもやってもしかたないしなあ。しかし、一度それぞれにどういうことをやってみたいか書き出しておくのはよさそうな気もする。研究ネタ的な。副研究テーマも決める必要があるし。

先日お話をいただいていたCode for AMAMIについて、さっそくサイトがオープンしていたのでSNSで紹介したりなど。なにか手伝えることあるかなあと思いつつ、やれることをやってみようという感じ。

2020年7月18日

午前は、「自然言語処理論」の期末試験。中間試験に比べると難易度が低かったように思える。中間試験では6割弱しか得点できなかったのだが、少しは挽回できたのではないだろうか。単位は取れてるだろう。今学期の試験はこれで終わり。あとはレポートが一本残っているのだが、それは明日にでもしゅっと書けそうだし、あとは来週の4連休がずっと朝から晩まで講義(と、レポートもきっとあるんだろうなあ)が終われば、今学期は終わり。大変といえば大変だけど、リモートのおかげもあってわりとやれたのではないか。

午後は『深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)』をひたすら読む。例によって、あまり深追いせずにざっくりと。あれこれと疑問に思っていたことがはっきり説明されていて、とても役立った。こうじゃないかと思っても、いまいちそうと確信をもってはいえないみたいなことがあるからなあ。また、自分自身の関心に近い領域についての概要を得られたり、必ず参照するべきだろうなという文献をいくつも得られたりして、その意味でもとてもよかった。

その後、鮨を食べたり、Kの実家へ少しうかがったり。荷物が多かったので帰りはタクシーで首都高を使って帰ってきたのだが、下道から眺めたことはあっても走ったことがない場所だったので、面白い。自分でも走ってみたいなあ。車を買う気はないのだけど、首都高を走りたいみたいなのはある(景色を観たいから)。帰宅して、大学院に入ったことをブログに書いてなかったのを昼に思い出したので、その件についてのエントリーを書いてポストした。

自然言語処理をもっと勉強しようと思って『言語処理のための機械学習入門 (自然言語処理シリーズ)』、『自然言語処理〔改訂版〕 (放送大学教材)』を注文したのが届いていたので、読み始める。

2020年7月17日

来週行われるトークセッションのリハーサルをしたり、あれこれミーティングしたりなど。

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)』を購入して読み始める。さっそく、自分の研究に取り入れられそうなリファレンスが見つかったりしてよい。ざっと読んでみる。

2020年7月16日

月曜夜からの首凝りと頭痛がまだ治らず、朝いったん起きてご飯を食べたがしんどいので、また寝床へ。昼まで寝ていて、やや回復。その後、ミーティングなどしたりしているうちに、夜頃になってようやく本調子な感じ。枕を換えたりしているのだが、それはそれで別のタイプの凝りになっているようで、難しい。運動するのと、あとは整体とかいってみようかなあ。

最近は研究ばかりしているので視野が狭くなりそうだなあと思って、先日のKindle版の安売りをしていた中で買った『学術都市アレクサンドリア (講談社学術文庫)』を読み始める。アレクサンドリアといえば、自分の中ではカヴァフィスやロレンス・ダレルだが、そのあたりの古代とのつながっている感じに、単純に憧れを持つ。仕事や研究はもっと実際的な話ばかりなのだが、そういう気分も忘れないようにしたいなあと思う。

と思っていたけど、やっぱ研究に関係することをやりたくなってきて、「自然言語処理を独習したい人のために - 東京都立大学 自然言語処理研究室(小町研)」で紹介されていた『言語処理のための機械学習入門 (自然言語処理シリーズ)』や評判の良い『自然言語処理〔改訂版〕 (放送大学教材)』を買ったり、途中でやめてた「言語処理100本ノック 2020 (Rev 1) - NLP100 2020」を再開したりなど。しかし手が動かないものだなあ。Pythonの文法があんまりわからないというのもあるけど。まあ、やっていくうちに慣れてくるだろう。

そういえば先日、ものに書かれた小さな説明書きみたいなのを読もうとして、自然と目から距離を置くみたいな動作を自分がしていることに気づいて、やや老眼的な感じになってきたのかなあと思う。でも、特にそんなことをしなくても見えることもあるから、体調によって違うのかなあ。体は順調に老化していくのであるなあ。

2020年7月15日

朝から人間ドック。ほんとはもっと前に予定されていたのだがコロナ全盛だったので避けて4ヶ月ほどずらしたのだった。しかし、いまはいまでまたぶり返してしまっているのだが、また伸ばすのもそれはそれで別のリスクがあるので、受けることにした。待ってる間、機械学習に関する資料やWebページを読む。しかし、一昨日の晩から続いている首凝りと頭痛で、どうにもしんどい感じ。吐き気がするほど頭痛がするわけではないけど、嫌な感じが続いていて、テンションが低い。

帰宅して、しばらく寝る。その後、ちょっと仕事をした後、夕食。昼ごろまでは首の右後ろが痛かったのが、今度は左後ろに痛みが移ってきた……。おまけに目の奥も痛む。パソコンに向かってると光で目が痛くなる感じになってきたので、届いた本を読むことに。『本を読む本 (講談社学術文庫)』。これを読むのは20数年ぶりか。読み方という意味では読書のスタート地点に導いてくれるベーシックな内容でよい本だと思うが、何を読めばいいのかというのが問題なんだよなあ。ところで読書法みたいな本は100冊は読んだだろうと思うのだが、一番良かったのはなんだろうなあと思ったりした。

2020年7月14日

朝から中期計画のミーティング。その後、あれこれミーティングしたり、CTO協会仕事をしたりなど。また、4月に入社した新卒エンジニアに機械学習について教えてもらい、ありがたい。若い人に新しいことを教えてもらえるのはとてもいい環境だと思う。

昨晩から首凝りがして、微妙に頭痛。ひどく痛むほどではないのだけど、テンションは下がる。それで、昨日はすぐに寝てしまった。今日もまだ微妙に痛い。嫌な感じ。

夜は、ご飯を食べた後、研究テーマの続き。やろうとしていることに活用できるかもしれない研究について解説記事を何度も繰り返して読んでいて、なんとなく意味がわかってきたような気もするが……という感じ。シュッとわかるようになりたいものだなあ。その後、考えたことについて研究所の週報にメモ書き。