検索技術勉強会/Search Engineering Tech Talk 2019 Summerに参加しました。

表題の通り2019/07/31に六本木メルカリオフィスで開催された検索技術勉強会/Search Engineering Tech Talk 2019 Summerに参加させていただきました。 イベントのハッシュタグは#searchtechjpです。

Search Engineering Tech Talk Search Engineering Tech Talk 2019 Summer - connpass

フードスポンサーのピアラ社について

ビューティ&ヘルス領域、食品領域に特価したマーケティングコミットカンパニーのPIALA社。 KPI達成を保証かつ成果報酬型の契約でマーケティングを請け負っている会社のようです。 PHPでのwebアプリケーションの開発経験が3年以上無いので私は応募できませんが、インフォメーションテクノロジー本部 / サーバーサイドエンジニアの募集があるようです。

ピザ美味しかったです。

ドリンクスポンサーのメルカリ社について

mercariというフリマアプリを運営している会社のようです。 私も使ってみたのですが、目安価格を自動で出してくれたり、次に何をするべきか表示してくれたり、非常に便利ですね。 Engineeringだけでも39ポジションの募集があり、中でもMySQL Reliabilityというポジションが日本一のフリマアプリという風格を感じます。

押すと出てくる自販機と会場の提供ありがとうございました。

オープニング by @tatakabaさん

資料は『Search Engineering Tech Talk 2019 Summer』です。

スポンサーの紹介と会の目的のおさらい、前回の復習をしていただきました。 前回参加できなかったのでありがたいです。

「うどん」の検索結果には何を出すべきか by 李晟圭さん

資料は 『「うどん」の検索結果には何を出すべきか』です。 Retty株式会社でWeb/検索チームと地盤チームのEMをされているらしい! 全体像からSuggestとSearch、表示順とそれから課題という流れで非常に分かりやすい発表でした。

入力枠を分けてキーワードをID化する、「鳳」と「凰」など間違えやすい感じはレーベンシュタイン距離をみて拾ってあげる、うどんは五反田にあるカレーの名店というのが学びでした。 ※エンジニアが見ると精神がおかしくなってしまいそうなうどんさんのHP。

「Rettyの価値は「見つかる」体験にある」、「検索はユーザさんとインタラクションができる唯一無二の機能」と熱い発言があり、この人と一緒に働いてみたいなと思いました。

ちなみにRettyもエンジニアの募集があるようです。

Elasticsearch における類似度ベクトル検索のベストプラクティスを求めて by 伊藤敬彦さん

資料は『Elasticsearch における類似度ベクトル検索のベストプラクティスを求めて』です。

クックパッドでソフトウェアエンジニアをされている伊藤敬彦さんの案外シュッとしていないという発表でした。

メルカリでも使われているfacebookresearch/faiss: A library for efficient similarity search and clustering of dense vectors.を使えばいいかもしれないが、導入障壁・開発コストを考えると、インデックスだけを返す外部ライブラリではなく、Elasticsearchの機能を利用できるプラグインを使いたい。 Searching with Deep Learningによると8次元のKD木でざっくり候補をK件くらいに絞って(O(N^(7/8)))からコサイン類似度を計算(O(K))すれば、全件のコサイン類似度を計算するよりも早く類似度が計算できる。 (10,000,000^(7/8) = 1,333,521くらい)

KD木をPythonで実装してみた。ドキュメントに対して取り出す個数が十分に小さいとき、差は歴然です。

グラタンの類義語として、グラタンとベシャメルソースがちゃんと出てきているのは(すごいのはベクトル化したword2vecな気がしないでもないが)、ちゃんと計算ができていてすごい! これを洗練されたESプラグインにしてくれたら嬉しいとのこと。

※発表とは直接関係ないのですが、Speaker Deckのリンクがクリックできなくなる仕様は本当に本当にconsidered harmful。

検索の運用って難しいよねって話 by 凡人ぷろぐらまさん

いこレポとかを運営されているアクトインディの運用事例紹介。

1台分のリクエストをリアルタイムに検証環境に流すのが学びでした。本番サーバの設定変更がカジュアルにできる環境なんでしょうか。 「怖がらずに触ってみる、どうせ落ちているのだから」という発言が印象に残っています。

他の方が書かれたイベントレポート

今回ブログ枠という物があるので、何人かはブログを書かれるはずです。

スピーカー・スポンサー募集中

connpassのページにフォームのリンクがあるので、登録してくださいとのことでした!

感想

私は普段フォルシアという検索を中心に受託開発をする会社で働いているので、社内でも検索の話はできるのですが、 検索技術勉強会には1人でも検索をやっている人達に会えて、情報交換ができたり、御社の検索いいですよねという話が懇親会でできたりと非常に楽しませていただきました。

3ヶ月後(Search Engineering Tech Talk 2019 Autumnかな?)また参加したいなと思っています!オーガナイザーの皆様ありがとうございました。