Wordファイルに貼り付けられている画像を効率的に取り出す方法

これを知ったときには、結構驚きだった。Wordファイルに貼り付けてある画像を、効率的に取り出せるなんて。

A Planet Named Shayol, 【超すごいTips知った】Wordのdocxファイルに貼られてる画像のオリジナルデータが欲しかったらd…

A Planet Named Shayol, 【超すごいTips知った】Wordのdocxファイルに貼られてる画像のオリジナルデータが欲しかったらd…

本当にできるか試してみた。以下が、Wordファイルの拡張子をzipにして、解凍したフォルダ。こんな構成になっている。

 

「word」ディレクトリをクリック。こんな感じ。画像ファイルは「media」ディレクトリに入っている。

 

「media」ディレクトリの中。今回サンプルで使ったWordファイルでは、拡張メタファイル形式で2つ貼りつけてあったので、それが格納されている。

 

ちなみに、試しにPowerPointやExcelでも同じことをやってみたら、同じようにディレクトリが作られた。PowerPointでは、スライド中に作成したグラフのデータを「embeddings」ディレクトリからExcelで取り出せることを確認したよ。

今後、誰かからもらったファイルの画像なんかのデータを取り出すのには、この方法が良いのかもなあ。