これを知ったときには、結構驚きだった。Wordファイルに貼り付けてある画像を、効率的に取り出せるなんて。
A Planet Named Shayol, 【超すごいTips知った】Wordのdocxファイルに貼られてる画像のオリジナルデータが欲しかったらd… A Planet Named Shayol, 【超すごいTips知った】Wordのdocxファイルに貼られてる画像のオリジナルデータが欲しかったらd… |
本当にできるか試してみた。以下が、Wordファイルの拡張子をzipにして、解凍したフォルダ。こんな構成になっている。
「word」ディレクトリをクリック。こんな感じ。画像ファイルは「media」ディレクトリに入っている。
「media」ディレクトリの中。今回サンプルで使ったWordファイルでは、拡張メタファイル形式で2つ貼りつけてあったので、それが格納されている。
ちなみに、試しにPowerPointやExcelでも同じことをやってみたら、同じようにディレクトリが作られた。PowerPointでは、スライド中に作成したグラフのデータを「embeddings」ディレクトリからExcelで取り出せることを確認したよ。
今後、誰かからもらったファイルの画像なんかのデータを取り出すのには、この方法が良いのかもなあ。