准教授

井智弘

い　ともひろ

: 情報工学研究院; 知能情報工学研究系
: 1985 生まれ
2012　博士（理学）九州大学
2012　九州大学大学院システム情報科学府情報学専攻博士後期課程修了
2010　九州大学大学院システム情報科学府情報学専攻修士課程修了

修士課程在学時に、特定の性質を持つ文字列を求めたり列挙したりする問題に取り組み始めました。求める文字列が数学的にどのように特徴付けられるのか？それをどのような手続きで効率的に求められるか？を考えるにつれ、組み合わせ的に広がる文字列の世界の面白さに魅了されました。

文字列を制する者は情報を制す

● 研究テーマ

❖文字列を効率的に処理する手法の開発

● 分野

情報学基礎、知能情報学

● キーワード

文字列検索、索引、データ圧縮、文字列パターンマイニング

● 実施中の研究概要

研究の対象は文字列です。文字列というと、我々が意思を伝達するために用いる、いわゆる「自然言語」を思い浮かべるかもしれませんが、ここではより一般的に「記号の列」を扱います。例えば、生命の設計図と言われる DNA の塩基配列は {A, T, G, C} の４つの記号からなる文字列ですし、音符の列も文字列です。コンピュータ上のあらゆる情報は記号の列（究極的には {0, 1} の記号からなるビット列）で表されているため、文字列を扱うことはコンピュータ科学の本質の一つです。
近年、情報化社会の進展やセンサーの高精度化を背景にコンピュータ上で処理すべき情報が爆発的に増加していることから、文字列を効率的に処理する手法の研究は重要性を増しています。例えば、「文字列検索」は２つの文字列（テキストとパターン）が与えられた時に、テキスト中のパターンの出現位置を求める処理ですが、このような基本的な処理にあっても、より効率的に行うために様々な手法が考案され続けています。特に、近年問題になっているデータの肥大化に対応するため、データを圧縮し圧縮データ上で直接処理を行うことで、蓄積と処理の効率を同時に向上させる技術（圧縮文字列処理技術）の開発に力を入れています。また、(1) 不一致を許した検索や文字の置換を許した検索などより高度な文字列処理の手法、(2) 繰り返し構造や回文構造などテキスト中の特徴的な構造を検出する手法、(3) テキスト中に頻出する文字列パターンを発見する手法などの研究も行っています。

● 今後進めたい研究

高速な実装および様々な実データを用いた解析

● 研究室ホームページ

http://www.donald.ai.kyutech.ac.jp/~tomohiro/