TensorFlow World 2019に参加した

2019-10-31

TensorFlow World 2019 参加メモ

概要

日時
- 2019/10/29-31の３日間
会場
- アメリカ、カリフォルニア州、Santa Clara Convention Center
出版メディアのO’ReillyとGoogleの共同開催で第１回目の開催
TensorFlow関連のイベントとしてはTensorFlow Dev Summitが別にあり、こちらは2017年から年１開催
規模感
- 参加者は300人程度
  - Keynote会場に椅子が700個程並べられ、1/2くらいが埋まっていた
- デモ展示企業は20程度
費用
- Expo Pass : $100（デモ展示会場とKeynoteへのアクセスのみ）
- Bronze Pass: $800（上記に加え、各種技術セッションへのアクセス）
コントリビュータ向けの招待制イベントのContributor Summitが2019/10/28に同時開催

Key Findings

現地に行って会話することが一番有益な情報を得られる
- オーストラリアのユーザグループ代表を見つけて話を聞けた。有用なデータ（sensitiveなデータ）を手に入れるのは日本に限らずどこでも難しいことを確認できた。
- Lead Developerを見つけて自分のPull Requestをアピールしたら、１週間でマージされた。
- Googlerと話して、v1とv2での開発体制の違いを確認できた。
  v1ではGoogleで開発して、OSSのGithubではミラーサイト的に公開されてるだけだった。そのためGoogle独自のBug Tracking SystemのIDがissue上に書かれていて、Google外の開発者が分からない事が多々あった。v2ではこれを無くし、各機能ごとにSIG(Special Interest Group)というグループを設け、コミュニティ主導で開発している。
TensorFlowはEnterpriseとEcosystem推しに変わっている
- 大学や企業研究ではPyTorchに押され気味で、version2.0で方向を転換し、コミュニティ主導での開発や企業での利用に梶を切っている。
- Contributor SummitにてGithubの方のセッションがあり、Tensorflowのイベントなのに「PyTorchが圧倒的」とGithubのstar数の遷移を交えてぶった切っていた。
コネも大事
- 招待制のContributor Summitに参加したい、と運営者に自分の貢献をメールでアピールして招待コードを貰って参加。
- 日本人参加者を見つけて話しかけたら日本のユーザグループの代表の方で、後日開催の振返りイベントに招待してもらえた。

内容

YouTubeに動画がアップされているので、それを見るのが正確です。
https://www.youtube.com/playlist?list=PLQY2H8rRoyvxcmHHRftsuiO1GyinVAwUg

目玉は以下二つ。それ以外は、既に発表済みのEcoSystemの話やユースケースのおさらいとCommunityを大事にします、というアピールだった。

v2での新機能
Enterprise版のサービス開始

所感

招待制のContributor Summitに参加
同時開催のコントリビュータ向けのイベントを見つけたので、今までの自分のGithubやStackOverFlowでの取り組みを運営者にメールし、招待コードを貰えて参加。ここでの各国からの参加者との会話が１番実りが大きかった。

ライトニングトークに応募して不採択
Ignite形式のLT枠があり応募したが落選。ただ、日本で開催された本イベントの振返り会のLT枠で発表する機会を貰えて好評だった。

https://youtu.be/c1WdEpssND8?t=7255

Contributor Summitにて、GithubのOmoju MillerさんがGithubのstar分析を紹介
ML系のOSSを登場時期ベースでまとめていた(下図)。
また、Githubのstar数の変遷を各種メジャーライブラリに関して紹介。TensorFlowに関しては下図右。2016年に落込みが見えるがはこれはPyTorchがでてきた時期。別途PyTorchとの比較も紹介していたが圧倒的だった。時系列でのGithubのstar数の変遷は各OSSの活発度がそのまま反映される筈なので面白い分析だった（参加者からも「この変遷はAPIで公開されてるの？」と質問があった）。

オーストラリア, メルボルンのユーザグループ代表との会話
- ランチ時に参加者に話しかけたらオーストラリアのユーザグループの代表だった。
- ユーザグループを発足して最初の一週間で200人が登録、現在500人が参加している。
  ちなみに、日本のユーザグループのslackチャネルは2000人くらい居る。
- ミートアップでは初心者向けのチュートリアルが多いそう
- 「学習させるデータを如何に手に入れるか」が一番大事で一番難しい、という話で盛り上がった。 “Departments in a company do NOT collaborate.”と言っていたので、部署間の壁というのは日本特有の問題でないことを再確認できた。
- データを手に入れてもどれだけ信頼できるものなのかも検証が必要と言っていた。
  歯抜けデータやフォーマットが整っていないものなど、やはり地道な前処理が必要との事。
ネットワーキングを促す面白い取り組み
早朝の5kmランイベントや、１対１で話者をどんどん変えていくSpeed Networkingが行われていた。 YouTubeなどで公演自体は聞ける事が多くなってきたので、現地で参加者同士で情報交換することがより大事になってきているし、自分が一番面白いと思った情報（TensorFlowのv1とv2での開発運営の違い）も参加者からの会話で得られた。

ライブラリ開発者がユースケースまで考えている訳ではない
Githubで新機能に関して議論される時はフォーマットとして必ずユースケースを併記することを求められていた。また、会場でLeed Developerと話した時も、「Any Feedbacks? what’s your usecase?」が最初に聞かれた質問だった。これらの話からライブラリは一生懸命開発されているが、まだまだユースケースを欲しているし、どういう用途に使われているのかにすごく興味を持っている事が伺えた。営利目的なら下図の右上か右下で活躍する事でビジネスに繋げられそうだし、コミュニティとしてもその役割が必要だと考えてくれている。

運営に関して
GoogleとO’Reilly以外の出展企業が少なく感じた。展示会場は20社程度だった。
自分が購入したExpo Passは開催２週間前に突然販売されたパスなので、参加者も想定より少なかったため急遽作ったパスだと思う。
Santa Clara Convention Centerはシリコンバレーで開催されるイベントの３大会場の一つで、会場全てを使った他のイベントでは展示ブース200社くらい入る規模の会場。今回のTensorFlow Worldは１回目の開催、かつ、CommunityやEcosystemなどにフォーカスしているからか、よくある同会場のイベントよりは規模が小さかった。