Как конвертировать из DOC в DOCX. В чем разница между Doc и DocX файлами и как их восстановить

Многие при скачивании или сохранении тестовых документов, созданных с использованием приложения Microsoft Office , сталкиваются с такими понятиями, как формат doc и docx. На первый взгляд различие в одном дополнительном символе, но если установленный сервис может поддерживать только определенный тип файлов, зачастую возникает масса неудобств.

Чаще всего на сегодняшний день встречаются файлы с расширением docx, но и ранее популярные.doc не менее актуальны. Правда, постепенно они используются все реже и реже. Да и офис более современных моделей способен открывать оба типа файлов, что нельзя сказать о более устаревших вариантах программного продукта.

Определение двух типов файлов

Прежде, чем начинать вести разговор об отличиях таких форматов, как.doc и.docx, следует разобраться с обозначением каждого из них.

Под doc понимают определенный тип электронных документов, которые формируется при работе с Microsoft Word . Сначала это было просто расширение для группы файлов, но в последствие так стали обозначать серию индивидуальных форматов компании Microsoft,

Docx — это сокращение, которое обозначает Office Open XML . Такое расширение текстовых документов используется для создания электронных документов с применением пакета программного продукта от Microsoft.

Основные различия между двумя типами файлов

В первую очередь разница файлов с этими форматами проявляется в возможности их использования в различных версиях пакетов от Microsoft. Программные продукты, выпущенные ранее 2003 года (в том числе и продукт указанного года) не смогут открыть и позволить работать с форматом docx. Использование файлов с таким разрешением возможно только в версиях офиса с 2007 года. При этом распознавать файлы с расширением doc может пакет любого года выпуска.

Но стоит помнить, что начиная с Microsoft Word 2007, появляется намного больше возможностей при создании текстовых документов. Поэтому при открытии старого формата.doc в более современном редакторе появится надпись «Режим ограниченной функциональности», который не позволит использовать все возможности редактора, ведь все равно сохранить их в doc не получится. Для того, чтобы с документом работать полноценно, следует сохранить его в усовершенствованном формате docx.

Для решения вопроса с открытием файла docx создан специальный конвертор, при использовании которого происходит распаковка требуемого файла с дальнейшей возможностью корректировки при необходимости. Ведь, по сути, файлы docx – ‘это специальные zip-архивы, в которых располагаются непосредственный документ в форме XML, а также все графики, рисунки, таблицы и схемы. Здесь же находятся файлы, которые определяют структуру и параметры содержания документа. Версия 2003 года и более ранние не могут справиться с самим процессом распаковки.

Именно такое сжатие и считается одним из главных различий между двумя типами офисных документов. Правда, благодаря ему размер файла становится значительно меньше. Особенно заметна разница в файлах, которые содержат большое число картинок или графиков. Для хранения docx намного удобнее, ведь занимает мало места на жестком диске.

Также стоит уделить внимание совместимости файлов с другими текстовыми процессорами. Формат docx в них поддерживается частично, а вот doc открывается совсем плохо. Существует один программный продукт – , который способен с легкостью открыть файл с расширением docx.

Также формат docx не получится использовать со шрифтами, начертание которых проводится справа налево. И этот тип Файлов поддерживает только собственные форматы Microsoft, не обращая внимание на установленные стандарты.

Основные отличия форматов doc и docx

Из полученной информации можно выделить следующее:

  1. Текстовый документ в формате docx открывается исключительно продуктами от компании Microsoft начиная с 2007 года, в то время, как doc – различными версиями Word.
  2. В файле docx используется zip- контейнер, что содержит документ в форме XМL.
  3. Doc вообще не предполагает наличие функции сжатия.
  4. Сторонние программы не совместимы (или очень плохо) с расширением doc.

Зная отличительные особенности таких файлов, теперь легко сориентироваться в целесообразности использования каждого из них.

Бывает, что у пользователей есть Windows XP на одном компьютере, а на другом – Windows 7 или более поздние версии. Либо на одном компьютере Word 2003, а на другом – Word 2007 или старше версии. Попробуем разобраться, в чем разница между вордовскими файлами.doc и.docx.

Приведу пример, когда может понадобиться перевод из.doc в.docx или наоборот. Иногда предлагают отказаться от бумажных счетов жилищно-коммунальных услуг, услуг связи стационарного телефона и перейти на получение счетов по email. При этом счета могут прислать в «старом» формате.doc.

  1. c помощью онлайн конвертера,
  2. c помощью программы Word.

Про онлайн-конвертер «online-convert.com/ru » подробнее в статье. А теперь перейдем ко второму способу преобразования с помощью Word.

Файлы с расширением.doc (например, test.doc или курсовая.doc) создаются с помощью ранних версий программы Word, а именно Word 97-2003. Для создания такого файла в меню Файл используется команда «Создать». Соответственно открываются файлы.doc без каких-либо проблем именно с помощью Word 97-2003.

Напомню, что расширение имени файла (к примеру, .doc, .txt, .mp4, .jpg) для пользователя может и ничего не значить, а для операционной системы Windows расширение является подсказкой, какой именно программой этот файл следует открывать.

С другой стороны, если файл создавать «с нуля» в программе Word 2007, то у такого файла автоматически будет создано расширение.docx.

Зачем такая путаница между файлами doc и docx?

Разработчиком офисной программы Word является компания Microsoft. В свое время эта компания анонсировала появление нового расширения.docx для файлов, которые занимают намного меньше места на жестком диске компьютера по сравнению с файлами со старым расширением.doc.

Кстати, особенно это заметно на «тяжелых» вордовских файлах с многочисленными картинками и таблицами. Файлы.docx с большим количеством картинок, таблиц, занимают на жестком диске компьютера значительно меньше места , чем такой же файл, но с расширением.doc.

Аналогично эксельные (Excel) таблицы с новым расширением.xlsx также существенно экономят место на жестком диске ПК по сравнению с таблицами со «старым» расширением.xls.

Другой плюс такого перехода с формата.doc на.docx состоит в том, что Word 2007 (и более поздние версии) имеют более широкий функционал , чем Word 97-2003.

Именно поэтому, если файл со «старым» расширением.doc открыть с помощью Word 2007 (или более поздней версии), то неожиданно сверху можно увидеть надпись «Режим ограниченной функциональности » (рис. 1). Он потому и ограниченный, что для файлов со «старым» расширением.doc нельзя использовать неограниченные возможности нового Word 2007.

Рис. 1 Файл с расширением.doc открывается в Word 2007 в режиме ограниченной функциональности

Чтобы убрать надпись «Режим ограниченной функциональности» и работать с документом в обычном режиме без ограничений, надо сохранить файл.doc в новом формате.docx, об этом подробнее ниже.

Итак, вордовские файлы могут иметь такие расширения:

  • .doc (созданы в редакторе Word 2003), либо
  • .docx (созданы в Word 2007 и позднее).

На первый взгляд, разница небольшая: всего лишь одна «лишняя» буква «х». Однако если периодически пользоваться то компьютером с Windows XP, то компьютером с Windows 7, то рано или поздно сталкиваешься с такой ситуацией. Создан файл в Word 2007, значит, он имеет расширение.docx. Если перенести файл.docx на Windows XP и попытаться открыть его там, то он может не открыться.

Как я писала выше, проблема в том, что старый Word 2003 (тот, который производит файлы с расширением.doc) не понимает, не открывает и не дружит с новыми файлами из Word 2007, у которых расширение.docx.

Как решить проблему? Во-первых, обращать внимание на то расширение, которое появляется у файла при его первом сохранении в Word.

Во-вторых, файл с расширением.docx можно сохранить в Word 2007 с другим расширением - .doc. Тогда у Вас будет один и тот же файл, сохраненный с разными расширениями. Например, в Word 2007 один и тот же файл можно сохранить так:

  • test.doc,
  • test.docx.

Тогда файл test.doc будет открываться в Word 2003 и в Word 2007 (правда, здесь в режиме ограниченной функциональности).

Как конвертировать docx в doc или doc в docx в Word 2007

Word 2003 года сохраняет и открывает документы с расширением.doc.
А Word 2007 г. (и позднее) сохраняет и открывает документы с расширением.docx.
Однако в Word 2007 есть возможность открыть документ.docx и сохранить его как.doc. Либо можно сделать наоборот: файл.doc сохранить как.docx.

Рис. 2 Как файл со «старым» расширением.doc сохранить с «новым» расширением.docx или наоборот сохранить.docx в.doc

Для этого в Word 2007 (или более поздняя версия Word)

  • откройте документ,
  • нажмите кнопку Office (цифра 1 на рис. 2),
  • в этом меню кликните по опции «Сохранить как»,
  • выберите папку или место для хранения файла (цифра 2 на рис. 2),
  • откройте выпадающий список «Тип файлов» (цифра 3 на рис. 2) - появится окно, как на рис. 3.

В старину, когда компьютеры были слабее современных мобильных телефонов, а люди пользовались операционной системой MS DOS, к именам текстовых файлов нередко добавляли расширение doc, подразумевая сокращённое слово «document». Однако в 90-х годах двадцатого века стараниями фирмы Microsoft по всей планете распространился новый вид цифровых документов - файлов с таким же расширением. В общем, речь пойдёт о результатах тех стараний. Ну и, конечно, немножко о форматах...

Как DOC попал в каждый офис

Можно ли заставить мир пользоваться только одним единственным комплектом офисных приложений? Да, и очень просто: достаточно создать закрытый бинарный формат файлов для документооборота, ни с чем не совместимый, кроме текстового процессора Word . Тогда, хочешь или нет, а купишь эту программу (в пакете Microsoft Office), никуда не денешься, ведь без неё ни одной фирме не прожить.

Так формат DOC попал в каждую (без преувеличения) контору, в каждую бухгалтерию, школу, университет, техникум и курсы обучения вышиванию крестиком. И как ни старались разработчики освободить народонаселение от жёсткой привязки к Microsoft Office, что-то получаться начало только с появлением LibreOffice, да и то пока лишь для документов с несложной компоновкой.

Суть в том, что формат DOC - бинарный и закрытый. Поди разбери, каким именно образом документ кодируется в последовательности нулей и единиц и как потом декодируется обратно. Разработчикам, стремившимся постичь суть формата, доводилось действовать, как говорится, по наитию. Потому в ранних версиях OpenOffice.org (предшественника LibreOffice) сложные *doc (с таблицами, рисунками и прочими объектами) нередко отображались довольно криво.

Двадцатого февраля 2008-го года планету облетела новость: международный комитет стандартизации (он же ISO) вынудил Microsoft открыть спецификации форматов Microsoft Office 2007. Однако радость оказалась преждевременной: открыли далеко не всё, оставив множество «белых пятен».

Что такое DOCX

Он же Office Open XML, он же OOXML, является родным братом (почти близнецом) Open Document Format, то бишь, ODF. (В Ubuntu вы, надо полагать, видели файлы с расширением odt, открываемые в OpenOffice.org или LibreOffice).

Формально эти форматы вроде бы разные, но суть одна: zip-архив, внутри которого содержится несколько XML-файлов с размеченным текстом, ну и прочие компоненты.

То есть, бинарный DOC, видимо, страсть как надоел даже самой конторе Microsoft , раз уж они взяли Office Open XML и сделали его форматом Word 2007 по умолчанию. А расширение таким файлам дали docx. Видимо, чтобы привычное «doc» тоже фигурировало и люди документы легко отличали от чего-либо иного.

Однако с признанием DOCX вышла неувязка. Поначалу ISO (комитет стандартизации) воспротивился. Мол, сомневаемся мы, что ваш вариант такой уж совместимый с альтернативным программным обеспечением . Кажется, вы малость схитрили, дабы монополию не терять.

Потом в ISO вроде бы успокоились, но зато возмутились местные комитеты стандартизации сразу в нескольких странах. Таких как Бразилия, Индия, Венесуэла, Дания. Чуть позже к ним присоединились ЮАР, Парагвай и Эквадор. Сказали, мол, не доверяем мы этому DOCX. А заодно и слишком сговорчивому ISO.

Так или иначе, хотя спецификации открыты, формат DOCX является проприетарным. В смысле, запатентованным. Возможность его использования всецело зависит от Microsoft.

Поэтому мир постепенно начал осознавать преимущества вышеупомянутого Open Document Format (того, который ODF). Во-первых, нет никаких патентов, бери и пользуйся как хочешь. Во-вторых, нет подвохов с совместимостью. К ним и переходим.

Менталитет монополиста

Капитализм подразумевает наличие множества небольших фирм. В том числе и таких, где считают каждую копейку. И в конторах разумно сомневаются в целесообразности ощутимых расходов на Microsoft Office . Зачем платить за дорогой софт, если есть свободный LibreOffice.

Вот тут-то, как говорится, шило и вылезло из мешка. Выяснилось, что LibreOffice открывает документы в формате DOCX запросто, а хитрый Word категорически отказывается понимать ODF. Несмотря на то, что DOCX и ODF - чуть ли не близнецы, как сказано ранее.

То есть, Microsoft, не желая распространения бесплатного LibreOffice как альтернативы недешёвому MS Office, препятствует использованию ODF в своих программных продуктах. И, вполне вероятно, делает это намеренно.

Следовательно, хотя Office Open XML существует где-то с 2006-го года, устаревший бинарный DOC выбросить на свалку истории не получается. Ведь ради последующего открытия в Word 2007 и Word 2010 разнообразные файлы, изготавливаемые в LibreOffice, доводится сохранять либо в RTF (небольшие), либо в DOC, увы.

Как с этим жить

В Российской Федерации Open Document Format стал официально узаконенным стандартом. Теперь ни один чиновник государственного учреждения не вправе заявить, мол, присылайте нам документы только в DOC и DOCX, а ваших ODF мы знать не желаем. Значит, путь для массового использования LibreOffice открыт.

В других странах, где законодательство пока иное, можно самостоятельно стремиться сделать Open Document Format популярным стандартом де-факто, не дожидаясь признания де-юре.

Каким образом? Просто использовать LibreOffice и рассказывать об этом бесплатном пакете приложений коллегам, деловым партнёрам, друзьям-приятелям, собеседникам в социальных сетях.

Почему нужно продвигать альтернативу? Вовсе не потому, что ODF чем-то лучше DOCX, они ведь очень похожи. А потому, что привязка всего мира к продукту корпорации-монополиста - это не очень хорошо.

Предыдущие публикации:

Последнее редактирование: 2012-11-03 21:57:20

Метки материала: ,

В процессе работы с документами нам часто приходится работать с различного рода форматами документов. В этой небольшой заметке разберем известные форматы, а также каким образом и с помощью каких инструментов пользователь может их открыть.

Формат doc

Файлы с расширением doc являются сокращением от английского document. Microsoft использовала данный формат для файлов текстового процессора Word до 2003 версии включительно. Сегодня doc открыть можно как современным текстовым процессором Word, так и устаревшими версиями. Также doc можно открыть текстовым процессором из бесплатного пакета офисных программ Open Office, либо онлайн сервисами работы с текстовыми файлами такими как Office Online и Google Docs.

Формат docx

Формат doc во многом был неудобен, в работе ввиду своей нестабильности, особенно в плане совместимости с разными версиями Word. В 2007 году вместе с выходом Office 2007 Microsoft сделала основным рабочим форматом для своего текстового процессора Word формат docx, или Open Office XML.

Формат docx является родным форматом для текстового процессора Word начиная с версии 2007, соответственно, открыть docx можно в Word 2007, 2010 или 2013. На самом деле, открыть docx можно и в старой 2000 – 2003й версии Word, однако, для этого придется установить специальное дополнение с сайта Microsoft —пакет обеспечения совместимости .

Пакет обеспечения совместимости позволяет открывать не только файлы формата docx в версиях Word ниже 2007й, но и файлы табличного процессора xlsx в устаревшем табличном процессоре Excel (2000 — 2003), а также формат pptx в устаревшем PowerPoint.

Формат rtf

Это так называемый «формат обогащенного текста» является межплатформенным форматом хранения текста, но в отличие от формата txt, позволяет хранить рисунки в документе. Вопроса «Чем открыть rtf?» не должно возникать, т.к. с ним может работать практически любой текстовый процессор. Например, в Windows системах бесплатный WordPad прекрасно справиться с задачей открытия rtf формата.

Формат txt

Самый простой формат сохранения текста. Его часто ассоциируют с блокнотом в Windows, однако, текстовые файлы может просмотреть даже файловый менеджер. В текстовом файле txt не может быть никаких рисунков или других элементов в принципе.

Формат pdf

Portable Document Format или просто pdf является межплатформенным форматом для электронных документов. Открыть для чтения pdf может бесчисленное множество программ, наверное, самой популярной является Adobe Reader. Начиная с 2013 версии Word может не только сохранять файлы в формате pdf, но открывать для редактирования их. Особенностью данного формата есть то, что напечатанный текст будет в точности таким, каким он представлен в файле pdf. Подробнее о работе с pdf файлами в .

“Скачать файл в формате.doc”, “скачать файл в формате.docx”, “сохранить в…”, “открыть с помощью…”. Разница в одну букву порой способна доставить много головной боли, если интернет-сервис принимает только определенный формат текстового файла или создается он на одном компьютере, а открывается на другом. Сегодня актуальны и файлы с именем с расширением.doc, и файлы с расширением имени.docx, однако ввиду постепенного обновления ПО первых становится все меньше.

Определение

DOC — расширение имени текстового файла, используемое текстовым процессором Microsoft Word, ставшее впоследствии обозначением серии собственных форматов.

DOCX (Office Open XML) — форматы файлов, применяемые для хранения электронных документов, созданных пакетом офисных приложений от Microsoft.

Сравнение

Разница между doc и docx заключается, в первую очередь, в возможности работы с ними пакетов программ. Формат doc подчиняется всем текстовым редакторам от Microsoft по умолчанию, не требуя надстроек, формат docx же Microsoft Word в версии 2003 года и ранних не воспринимается, его поддержка начинается в версии Word 2007. Решается вопрос с помощью дополнительного конвертера.

Несоответствие docx Word 2003 объясняется тем, что этот формат файлов предполагает сжатие, и сам по себе является zip-архивом, внутри которого содержатся собственно текстовый документ в виде XML, графика и файлы, определяющие свойства документа и отношения между содержимым контейнера. Версия 2003 не может его распаковать. Сжатие определяет и одно из основных отличий между форматами doc и docx — размер файла в последнем случае несколько меньше.

В сторонних текстовых процессорах docx поддерживается опционально, но в самом популярном из них пакете OpenOffice такая поддержка имеется. Формат doc без танцев с бубнами со сторонними редакторами совместим плохо. Docx не работает с языками с начертанием справа налево. Кроме того, в ряде случаев формат docx поддерживает только собственные форматы Microsoft, игнорируя стандарты: к примеру, вместо SVG — WMF.

Выводы сайт

  1. Файл формата doc можно открыть любой версией текстового процессора от Microsoft, файл docx — только версиями Word начиная от 2007.
  2. Docx — zip-контейнер для файлов XML.
  3. Doc не поддерживает сжатие.
  4. Doc плохо совместим со сторонними редакторами.