icon

Shota Sasaki

Research Interests, Word embeddings, Short Answer Scoring, Commonsense reasoning, Information Retrieval.

Job

  • 2023.06 - Present Academic Researcher at Tohoku University FaiLab (Part time).

  • 2023.04 - Present Research Scientist at CyberAgent Inc. AI Lab.

  • 2023.04 - Present Visiting Scientist at RIKEN Center for Advanced Intelligence Projects (Part time).

  • 2019.04 - 2023.03 Researcher at RIKEN Center for Advanced Intelligence Projects.

Education

  • 2020.10 - 2022.09 Doctor of Information Science. Graduate School of Information Science, Tohoku University, Japan. Major: Natural Language Processing.

  • 2017.10 - 2017.12 Research Internship at Johns Hopkins University, Baltimore, USA.

  • 2017.04 - 2019.03 Master of Information Science. Graduate School of Information Science, Tohoku University, Japan. Major: Natural Language Processing.

  • 2013.04 - 2017.03 Bachelor of Engineering. Faculty of Engineering, Tohoku University, Japan. Major: Natural Language Processing.

Publications & Presentations (International)

  • Masahiro Makino, Yuya Asazuma, Shota Sasaki, Jun Suzuki. The Impact of Integration Step on Integrated Gradients. In Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics: Student Research Workshop (EACL SRW), Mar 2024.

  • Aizawa et al. LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs. arXiv, Jul 2024.

  • Hwichan Kim, Shota Sasaki, Sho Hoshino, Ukyo Honda. A Single Linear Layer Yields Task-Adapted Low-Rank Matrices. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), May 2024.

  • Hiroto Kurita, Ikumi Ito, Hiroaki Funayama, Shota Sasaki, Shoji Moriya, Ye Mengyu, Kazuma Kokuta, Ryujin Hatakeyama, Shusaku Sone, Kentaro Inui. TohokuNLP at SemEval-2023 Task 5: Clickbait Spoiling via Simple Seq2Seq Generation and Ensembling. In Proceedings of the 17th International Workshop on Semantic Evaluation (SemEval), Jul 2023. Best Paper Award Nomination. 1st place.

  • Shota Sasaki, Benjamin Heinzerling, Jun Suzuki and Kentaro Inui. Examining the effect of whitening on static and contextualized word embeddings. Information Processing & Management, Vol.60, No.3, May 2023.

  • Shota Sasaki, Benjamin Heinzerling, Jun Suzuki and Kentaro Inui. Examining the effect of whitening on static and contextualized word embeddings. Presentation at Information Processing & Management Conference 2022, October 2022.

  • Shota Sasaki, Jun Suzuki and Kentaro Inui. Subword-Based Compact Reconstruction for Open-Vocabulary Neural Word Embeddings. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol.29, pp.3551-3564, November 2021.

  • Hiroaki Funayama, Shota Sasaki, Yuichiroh Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita and Kentaro Inui. Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation. In Proceedings of the 2020 ACL Student Research Workshop (ACL SRW), pp.237–243, July 2020.

  • Shota Sasaki, Jun Suzuki and Kentaro Inui. Subword-based Compact Reconstruction of Word Embeddings. In Proceedings of the 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2019), June 2019.

  • Kazuaki Hanawa*, Shota Sasaki*, Hiroki Ouchi, Jun Suzuki and Kentaro Inui (* equal contribution). The Sally Smedley Hyperpartisan News Detector at SemEval-2019 Task 4. In Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval), June 2019. 3rd place out of 42 teams.

  • Shota Sasaki, Shuo Sun, Shigehiko Schamoni, Kevin Duh and Kentaro Inui. Cross-lingual Learning-to-Rank with Shared Representations. In Proceedings of the 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2018), June 2018.

  • Shota Sasaki, Sho Takase, Naoya Inoue, Naoaki Okazaki, Kentaro Inui. Handling Multiword Expressions in Causality Estimation. In Proceedings of International Conference on Computational Semantics (IWCS), September 2017.

Publications & Presentations (Domestic)

  • 栗原健太郎, 三田雅人, 張培楠, 佐々木翔大, 石上亮介, 岡崎直観. LCTG Bench: 日本語LLMの制御性ベンチマークの構築. 言語処理学会第30回年次大会, 3月 2024.

  • 牧野雅紘, 浅妻佑弥, 佐々木翔大, 鈴木潤. Integrated Gradientsにおける理想の積分ステップ数はインスタンス毎に異なる. 言語処理学会第30回年次大会, 3月 2024. 委員特別賞

  • 謝素春, 佐々木翔大, Yunmeng Li, 坂田将樹, 赤間怜奈, 鈴木潤. 英語中心の大規模言語モデルの言語横断汎化能力. 言語処理学会第30回年次大会, 3月 2024.

  • 栗原健太郎, 佐々木翔大, 張培楠, 石上亮介, 三田雅人, 加藤明彦. 日本語LLMベンチマーク構築に向けて. 第18回NLP若手の会 シンポジウム (YANS), 8月 2023.

  • 邊土名 朝飛, 友松 祐太, 佐々木 翔大, 阿部 香央莉, 乾 健太郎. 多様なタスク指向対話データの収集を目的としたクラウドソーシングにおけるインストラクションの設計 ―クリニック予約対話を例に―. 2023年度人工知能学会全国大会(第37回), 6月 2023.

  • 佐々木翔大, Benjamin Heinzerling, 鈴木潤, 乾健太郎. 白色化が単語埋め込みに及ぼす効果の検証. 言語処理学会第29回年次大会, 3月 2023.

  • 牧野雅紘, 浅妻佑弥, 佐々木翔大, 鈴木潤. XAIにおける忠実性評価手法の考察. 言語処理学会第29回年次大会, 3月 2023.

  • 佐藤俊,大内啓樹,塙一晃,佐々木翔大,乾健太郎. 事例ベース推論を行うニューラルモデルの説明性とハブ現象の関係. 情報処理学会 第249回自然言語処理研究会 (NL研), 7月 2021. 優秀研究賞山下記念研究賞 受賞

  • 佐藤俊,大内啓樹,佐々木翔大,塙一晃, 乾健太郎. 説明性の高いニューラルモデルの予測確信度に関する分析. 言語処理学会第27回年次大会,pp.1204-1209, 3月 2021.

  • 佐々木翔大,大内啓樹,鈴木潤,Ana Brassard,乾健太郎. 単一評価サンプルのためのトランズダクティブ学習. 言語処理学会第26回年次大会,3月 2020.

  • 佐藤俊, 大内啓樹, 塙一晃, 佐々木翔大, 乾健太郎. 訓練過程における予測ラベルの遷移頻度情報を用いた予測確信度計算手法の改善. 第15回NLP若手の会 シンポジウム (YANS),9月 2020.

  • 舟山弘晃,佐々木翔大,水本智也,三田雅人,鈴木潤,松林優一郎,乾健太郎. 記述式答案自動採点のための確信度推定手法の検討. 言語処理学会第26回年次大会,3月 2020.

  • 佐藤俊,佐々木翔大,大内啓樹,鈴木潤,乾健太郎. 評価データのクラスタリングを用いた記述式答案自動採点のためのトランズダクティブ学習. 言語処理学会第26回年次大会,3月 2020.

  • 舟山弘晃,佐々木翔大,水本智也,三田雅人,鈴木潤,乾健太郎. 自動採点における確信度推定手法. 第14回NLP若手の会 シンポジウム,8月 2019.

  • 中村拓,田然,佐々木翔大,乾健太郎. 単語埋め込みにおける複数視点の対義語判定. 2019年度人工知能学会全国大会(第33回), 4 pages, 6月 2019.

  • 佐々木翔大,鈴木潤,乾健太郎. サブワードに基づく単語分散表現の縮約モデリング. 言語処理学会第25回年次大会,3月 2019.

  • 佐々木翔大,鈴木潤,乾健太郎. サブワードに基づく単語ベクトルの再構築. 第13回NLP若手の会 シンポジウム,8月 2018. 奨励賞 受賞

  • Shota Sasaki, Shuo Sun, Shigehiko Schamoni, Kevin Duh and Kentaro Inui. Cross-lingual Information Retrieval with Shared Representations. The 5th CWRU-TOHOKU Joint Workshop,8月 2018.

  • 佐々木翔大,Shuo Sun,Shigehiko Schamoni,Kevin Duh,乾健太郎. 言語横断的情報検索の大規模データセットとパラメータ共有モデル. 言語処理学会第24回年次大会,3月 2018. 若手奨励賞 受賞

  • 佐々木翔大,田然,乾健太郎. 数量表現と比較に着目した意味解析に向けて. 第12回NLP若手の会 シンポジウム,9月 2017.

  • 佐々木翔大,高瀬翔,井之上直也,岡崎直観,乾健太郎. 複単語表現を利用した因果関係推定モデルの改善. 第231回自然言語処理研究会・第116回音声言語情報処理研究会,5月 2017.

  • 佐々木翔大,高瀬翔,井之上直也,岡崎直観,乾健太郎. 分散表現を用いた因果関係知識のモデル化. 第11回NLP若手の会 シンポジウム,8月 2016.

Activities

  • Paper Reviewer (EMNLP, AACL, COLING, SemEval, KAIS, ACR Rolling Review)
  • EMNLP 2021 (Outstanding reviewer)
  • NLP若手の会(YANS) 運営委員 (2019-2020)