icon

Shota Sasaki

  • Research Scientist at CyberAgent Inc. AI Lab NLP team. (sasaki_shota@cyberagent.co.jp)
  • Visiting Scientist at RIKEN Center for Advanced Intelligence Projects.

Research Interests, Word embeddings, Short Answer Scoring, Commonsense reasoning, Information Retrieval.

Education & Job

  • 2023.04 – Research Scientist at CyberAgent Inc. AI Lab.

  • 2022.04 - Visiting Scientist at RIKEN Center for Advanced Intelligence Projects (Part time).

  • 2022.10 – 2023.03 Researcher at Inui laboratory, Tohoku University (Part time).

  • 2020.10 – 2022.09 Doctor of Information Science. Graduate School of Information Science, Tohoku University, Japan. Major: Natural Language Processing.

  • 2019.04 - 2023.03 Researcher at RIKEN Center for Advanced Intelligence Projects (Full time).

  • 2017.10 - 2017.12 Research Internship at Johns Hopkins University, Baltimore, USA.

  • 2017.04 – 2019.03 Master of Information Science. Graduate School of Information Science, Tohoku University, Japan. Major: Natural Language Processing.

  • 2013.04 – 2017.03 Bachelor of Engineering. Faculty of Engineering, Tohoku University, Japan. Major: Natural Language Processing.

Publications & Presentations (International)

  • Shota Sasaki, Benjamin Heinzerling, Jun Suzuki and Kentaro Inui. Examining the effect of whitening on static and contextualized word embeddings, Information Processing & Management, Vol.60, No.3, May 2023.

  • Shota Sasaki, Benjamin Heinzerling, Jun Suzuki and Kentaro Inui. Examining the effect of whitening on static and contextualized word embeddings. Presentation at Information Processing & Management Conference 2022,October 2022.

  • Shota Sasaki, Jun Suzuki and Kentaro Inui. Subword-Based Compact Reconstruction for Open-Vocabulary Neural Word Embeddings. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol.29, pp.3551-3564,November 2021.

  • Hiroaki Funayama, Shota Sasaki, Yuichiroh Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita and Kentaro Inui. Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation. In Proceedings of the 2020 ACL Student Research Workshop (2020 ACL SRW), pp.237–243,July 2020.

  • Shota Sasaki, Jun Suzuki and Kentaro Inui. Subword-based Compact Reconstruction of Word Embeddings. In Proceedings of the 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2019),June 2019.

  • Kazuaki Hanawa*, Shota Sasaki*, Hiroki Ouchi, Jun Suzuki and Kentaro Inui. (* equal contribution) The Sally Smedley Hyperpartisan News Detector at SemEval-2019 Task 4. To appear in Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval 2019), June 2019. 3rd place out of 42 teams.

  • Shota Sasaki, Shuo Sun, Shigehiko Schamoni, Kevin Duh and Kentaro Inui. Cross-lingual Learning-to-Rank with Shared Representations. In Proceedings of the 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2018),June 2018. PDF Data

  • Shota Sasaki, Sho Takase, Naoya Inoue, Naoaki Okazaki, Kentaro Inui. Handling Multiword Expressions in Causality Estimation. In Proceedings of International Conference on Computational Semantics (IWCS),September 2017. PDF code

Publications & Presentations (Domestic)

  • 佐藤俊,大内啓樹,塙一晃,佐々木翔大,乾健太郎. 事例ベース推論を行うニューラルモデルの説明性とハブ現象の関係. 情報処理学会 第249回自然言語処理研究会(NL研),7月 2021. 優秀研究賞山下記念研究賞 受賞

  • 佐藤俊,大内啓樹,佐々木翔大,塙一晃, 乾健太郎. 説明性の高いニューラルモデルの予測確信度に関する分析. 言語処理学会第27回年次大会,pp.1204-1209, 3月 2021.

  • 佐々木翔大,大内啓樹,鈴木潤,Ana Brassard,乾健太郎. 単一評価サンプルのためのトランズダクティブ学習. 言語処理学会第26回年次大会,3月 2020.

  • 佐藤俊, 大内啓樹, 塙一晃, 佐々木翔大, 乾健太郎 訓練過程における予測ラベルの遷移頻度情報を用いた予測確信度計算手法の改善. 第15回NLP若手の会 シンポジウム (YANS),9月 2020.

  • 舟山弘晃,佐々木翔大,水本智也,三田雅人,鈴木潤,松林優一郎,乾健太郎. 記述式答案自動採点のための確信度推定手法の検討. 言語処理学会第26回年次大会,3月 2020.

  • 佐藤俊,佐々木翔大,大内啓樹,鈴木潤,乾健太郎. 評価データのクラスタリングを用いた記述式答案自動採点のためのトランズダクティブ学習. 言語処理学会第26回年次大会,3月 2020.

  • 舟山弘晃,佐々木翔大,水本智也,三田雅人,鈴木潤,乾健太郎. 自動採点における確信度推定手法. 第14回NLP若手の会 シンポジウム,8月 2019.

  • 中村拓,田然,佐々木翔大,乾健太郎. 単語埋め込みにおける複数視点の対義語判定. 2019年度人工知能学会全国大会(第33回), 4 pages, 6月 2019.

  • 佐々木翔大,鈴木潤,乾健太郎. サブワードに基づく単語分散表現の縮約モデリング. 言語処理学会第25回年次大会,3月 2019.

  • 佐々木翔大,鈴木潤,乾健太郎. サブワードに基づく単語ベクトルの再構築.Poster 第13回NLP若手の会 シンポジウム,8月 2018. 奨励賞 受賞

  • Shota Sasaki, Shuo Sun, Shigehiko Schamoni, Kevin Duh and Kentaro Inui. Cross-lingual Information Retrieval with Shared Representations. The 5th CWRU-TOHOKU Joint Workshop,8月 2018.

  • 佐々木翔大,Shuo Sun,Shigehiko Schamoni,Kevin Duh,乾健太郎. 言語横断的情報検索の大規模データセットとパラメータ共有モデル.PDF 言語処理学会第24回年次大会,3月 2018. 若手奨励賞 受賞

  • 佐々木翔大,田然,乾健太郎. 数量表現と比較に着目した意味解析に向けて.Poster 第12回NLP若手の会 シンポジウム,9月 2017.

  • 佐々木翔大,高瀬翔,井之上直也,岡崎直観,乾健太郎. 複単語表現を利用した因果関係推定モデルの改善.PDF 第231回自然言語処理研究会・第116回音声言語情報処理研究会,5月 2017.

  • 佐々木翔大,高瀬翔,井之上直也,岡崎直観,乾健太郎. 分散表現を用いた因果関係知識のモデル化.Poster 第11回NLP若手の会 シンポジウム,8月 2016.

Activities

  • SemEval 2019 reviewer
  • NLP若手の会(YANS) 運営委員 (2019-2020)
  • COLING 2020 reviewer
  • Knowledge and Information Systems (KAIS) reviewer
  • EMNLP 2021 reviewer (Outstanding reviewer)
  • ACL Rolling review reviewer
  • AACL 2022 reviewer