「動かないAI」を生む非構造データが97%、XMLによる構造データ化の必要性 - dataway
dataway
19Picks
コメント
注目のコメント
XMLでもJASONでもいいですが、マークアップ言語もしくはデータベースソフトでちゃんと構造化されたデータであることが重要です。
ところで、DOCX、XLSX、PPTXなどの拡張子をもつOFFICE系ソフトも、実は中身はZIP圧縮されたXMLファイルだとご存知でした?そこまでオープンされているからこそ他社のOFFICE系ソフトで開けるのです。XMLなどのマークアップ言語でデータを構造化した状態で保存し、AIで使えるデータにする。
この流れは、例えばサイバーセキュリティの領域でいうSTIX(Structured Thread Information eXpression)にも繋がってきますね。サイバー攻撃発生時の観測情報を、構造化して記録し、機械処理しやすくする形式です。
ビッグデータの活用が必須になってくる中で求められる流れですね。