{"id":640,"date":"2010-05-20T08:13:57","date_gmt":"2010-05-20T07:13:57","guid":{"rendered":"http:\/\/www.sachaheck.net\/blog\/?p=640"},"modified":"2010-05-20T08:14:18","modified_gmt":"2010-05-20T07:14:18","slug":"docx-bilder-word-extrahieren","status":"publish","type":"post","link":"https:\/\/www.sachaheck.net\/blog\/allgemeines\/docx-bilder-word-extrahieren","title":{"rendered":"Docx: Bilder aus Word-Dokumenten extrahieren"},"content":{"rendered":"<p>Wenn man regelm\u00e4\u00dfig InDesign-Blogs liest und in Fachforen unterwegs ist, begegnen einem fast tagt\u00e4glich sehr wertvolle Tipps. So wie gerade eben. Diesen hier finde ich pers\u00f6nlich so einfach und gleichzeitig so cool, dass ich ihn hier mal posten mu\u00df :)<\/p>\n<p>Wir alle kennen das: F\u00fcr unser Layout bekommen wir vom Kunden Word-Dokumente geliefert. Sehr oft gibt es keinen extra Ordner mit den dazu geh\u00f6rigen Bildern wie wir es br\u00e4uchten um diese in InDesign platzieren zu k\u00f6nnen. Nun, seit es das Docx-Format gibt es hier einen coolen Trick um an die Bilder zu kommen. Das X im Namen steht f\u00fcr XML. Seit der Windows-Version 2007 bzw. der Macintosh-Version 2008 werden Dokumente im Format \u00bbOffice Open XML\u00ab abgespeichert. Nun stellt XML ja immer eine Struktur da. Solche Formate die auf XML basieren gibt es mehrere im Publishing-Bereich, z.B. IDML (InDesign Markup Language) oder auch ePub (das eBook Format das InDesign auch exportieren kann). Allen ist gemeinsam, dass man diese interne Struktur einsehen kann. Wie geht das?<\/p>\n<p>Zuerst m\u00fcssen wir die Endung von docx zu zip ab\u00e4ndern:<\/p>\n<p><img loading=\"lazy\" class=\"alignnone size-full wp-image-641\" title=\"docx_zu_zip\" src=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/docx_zu_zip.jpg\" alt=\"\" width=\"267\" height=\"96\" \/><\/p>\n<p>Wir m\u00fcssen dann die Meldung best\u00e4tigen und erhalten eine ZIP-Datei.<\/p>\n<p><img loading=\"lazy\" class=\"alignnone size-full wp-image-642\" title=\"docx_zip\" src=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/docx_zip.jpg\" alt=\"\" width=\"473\" height=\"171\" srcset=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/docx_zip.jpg 473w, https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/docx_zip-300x108.jpg 300w\" sizes=\"(max-width: 473px) 100vw, 473px\" \/><\/p>\n<p>Diese ZIP-Datei l\u00e4sst sich nun wie jede komprimierte Datei mit einem entsprechenden Tool entpacken, z.B. Stuffit Expander oder auch mit dem OSX-internen \u00bbArchive Utility\u00ab (fr\u00fcher: BOM Archive Helper\u00ab)<\/p>\n<p><img loading=\"lazy\" class=\"alignnone size-full wp-image-643\" title=\"entzippen\" src=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/entzippen.jpg\" alt=\"\" width=\"449\" height=\"208\" srcset=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/entzippen.jpg 449w, https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/entzippen-300x138.jpg 300w\" sizes=\"(max-width: 449px) 100vw, 449px\" \/><\/p>\n<p>Wir erhalten einen Ordner mit allen zugeh\u00f6rigen Dateien. Im Ordner \u00bbMedia\u00ab liegen alle unsere Bilder in Original Aufl\u00f6sung:<\/p>\n<p><img loading=\"lazy\" class=\"alignnone size-full wp-image-644\" title=\"XML_Struktur\" src=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/XML_Struktur.jpg\" alt=\"\" width=\"228\" height=\"382\" srcset=\"https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/XML_Struktur.jpg 228w, https:\/\/www.sachaheck.net\/blog\/wp-content\/uploads\/2010\/05\/XML_Struktur-179x300.jpg 179w\" sizes=\"(max-width: 228px) 100vw, 228px\" \/><\/p>\n<p>Man kann das Ganze auch schneller haben, z.B. mit einem entsprechenden AppleScript, dieses Skript von Shane Stanley wurde <a href=\"http:\/\/indesignsecrets.com\/drag-and-drop-applescripts-for-epub-idml-etc.php\" target=\"_blank\">hier<\/a> auf InDesignSecrets pr\u00e4sentiert.<\/p>\n<div class=\"shariff\"><ul class=\"shariff-buttons theme-default orientation-horizontal buttonsize-medium\"><li class=\"shariff-button twitter shariff-nocustomcolor\" style=\"background-color:#1e3050\"><a href=\"https:\/\/twitter.com\/share?url=https%3A%2F%2Fwww.sachaheck.net%2Fblog%2Fallgemeines%2Fdocx-bilder-word-extrahieren&text=Docx%3A%20Bilder%20aus%20Word-Dokumenten%20extrahieren\" title=\"Bei X (Twitter) teilen\" aria-label=\"Bei X (Twitter) teilen\" role=\"button\" rel=\"noreferrernoopener nofollow\" class=\"shariff-link\" style=\"; background-color:#000000; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style=\"\"><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" height=\"1em\" viewBox=\"0 0 512 512\"><!--! Font Awesome Free 6.4.2 by @fontawesome - https:\/\/fontawesome.com License - https:\/\/fontawesome.com\/license (Commercial License) Copyright 2023 Fonticons, Inc. --><style>svg{fill:#ffffff}<\/style><path d=\"M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z\"\/><\/svg><\/span><span class=\"shariff-text\">twittern<\/span>&nbsp;<\/a><\/li><li class=\"shariff-button facebook shariff-nocustomcolor\" style=\"background-color:#4273c8\"><a href=\"https:\/\/www.facebook.com\/sharer\/sharer.php?u=https%3A%2F%2Fwww.sachaheck.net%2Fblog%2Fallgemeines%2Fdocx-bilder-word-extrahieren\" title=\"Bei Facebook teilen\" aria-label=\"Bei Facebook teilen\" role=\"button\" rel=\"noreferrernoopener nofollow\" class=\"shariff-link\" style=\"; background-color:#3b5998; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style=\"\"><svg width=\"32px\" height=\"20px\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 18 32\"><path fill=\"#3b5998\" d=\"M17.1 0.2v4.7h-2.8q-1.5 0-2.1 0.6t-0.5 1.9v3.4h5.2l-0.7 5.3h-4.5v13.6h-5.5v-13.6h-4.5v-5.3h4.5v-3.9q0-3.3 1.9-5.2t5-1.8q2.6 0 4.1 0.2z\"\/><\/svg><\/span><span class=\"shariff-text\">teilen<\/span>&nbsp;<\/a><\/li><li class=\"shariff-button linkedin shariff-nocustomcolor\" style=\"background-color:#1488bf\"><a href=\"https:\/\/www.linkedin.com\/sharing\/share-offsite\/?url=https%3A%2F%2Fwww.sachaheck.net%2Fblog%2Fallgemeines%2Fdocx-bilder-word-extrahieren\" title=\"Bei LinkedIn teilen\" aria-label=\"Bei LinkedIn teilen\" role=\"button\" rel=\"noreferrernoopener nofollow\" class=\"shariff-link\" style=\"; background-color:#0077b5; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style=\"\"><svg width=\"32px\" height=\"20px\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 27 32\"><path fill=\"#0077b5\" d=\"M6.2 11.2v17.7h-5.9v-17.7h5.9zM6.6 5.7q0 1.3-0.9 2.2t-2.4 0.9h0q-1.5 0-2.4-0.9t-0.9-2.2 0.9-2.2 2.4-0.9 2.4 0.9 0.9 2.2zM27.4 18.7v10.1h-5.9v-9.5q0-1.9-0.7-2.9t-2.3-1.1q-1.1 0-1.9 0.6t-1.2 1.5q-0.2 0.5-0.2 1.4v9.9h-5.9q0-7.1 0-11.6t0-5.3l0-0.9h5.9v2.6h0q0.4-0.6 0.7-1t1-0.9 1.6-0.8 2-0.3q3 0 4.9 2t1.9 6z\"\/><\/svg><\/span><span class=\"shariff-text\">mitteilen<\/span>&nbsp;<\/a><\/li><\/ul><\/div>","protected":false},"excerpt":{"rendered":"<p>Sehr oft gibt es keinen extra Ordner mit den dazu geh\u00f6rigen Bildern wie wir es br\u00e4uchten um diese in InDesign platzieren zu k\u00f6nnen. Nun, seit es das Docx-Format gibt es hier einen coolen Trick um an die Bilder zu kommen.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1,112],"tags":[],"_links":{"self":[{"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/posts\/640"}],"collection":[{"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/comments?post=640"}],"version-history":[{"count":3,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/posts\/640\/revisions"}],"predecessor-version":[{"id":647,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/posts\/640\/revisions\/647"}],"wp:attachment":[{"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/media?parent=640"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/categories?post=640"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sachaheck.net\/blog\/wp-json\/wp\/v2\/tags?post=640"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}