Копирование файлов с помощью rsync. Резервное копирование с rsync

рекрут 24 октября 2011 в 00:52

Rsync: мощная утилита для быстрого, гибкого удаленного и локального копирования файлов

Rsync разработан для замены rcp – древней программы для удаленного копирования под Unix. Благодаря широким возможностям синхронизации и передачи файлов, rsync часто применяется для создания зеркал.
Использование хитроумного алгоритма, позволяет rsync передавать только изменения в файлах, причем для выявления изменений ему не надо сравнивать два файла. Кроме того, rsync производит сжатие на лету, позволяя тем самым передавать файлы с максимальной эффективностью.
Кроме вышеописанных вкусностей, rsync обладает также и несколькими полезными возможностями обеспечения безопасности. Он поддерживает ssh – рекомендованный протокол для безопасной передачи данных; перед обработкой информации производит ее запись во временный файл, чтобы ничего не случилось с оригиналом, наконец, он поддерживает специальный режим безопасной отладки команд.
Rsync прост в использовании, но не является программой «click-and-play». Это -мощный инструмент, который может быть очень полезным, но не стоит забывать об осторожности, так как его с помощью легко что-нибудь испортить.

Синтаксис утилиты
Синтаксис утилиты простой и довольно обыденный.
rsync [опции] источник [приемник]
Указав только источник, мы увидим список файлов без операции копирования.

Опции и примеры
Для простоты понимания, операции синхронизации привожу сперва локально.
Быстрый способ синхронизировать два каталога, это использовать опцию -a :
rsync -a foobar_src/ foobar_dst/
В данном случае файлы и директории из источника скопируются в приемник, при этом, если там были файлы, то совпавшие по имени будут перезаписаны, а остальные не тронуты.

Опция -a задает архивный режим работы утилиты, и является эквивалентом набора опций:
-r, --recursive - рекурсивный режим;
-l, --links - пересоздание symlinks , это значит, что символические ссылки будут так же переноситься;
-p, --perms - перенос прав;
-t, --times - передача времени модификации и его обновление на удаленной системе. Этот ключ должен быть установлен для точной синхронизации;
-g, --group - установить группу конечного файла таким же, как и у исходного;
-o, --owner - установить владельца конечного файла таким же, как и у исходного;
-D, - same as --devices --specials - установить тип файла устройства и файла специального типа таким же, как у исходного.
В итоге получаем копию директории источника. Кстати, это можно использовать при переносе ОС на другой винчестер, подправив /etc/fstab, установив/переустановив grub на новом винте - получаем рабочую систему, но это уже другая тема.

Для вывода информации о работе утилиты, существует опция -v, --verbose . Чем больше опций -v , тем боле информативным будет вывод утилиты. Максимальная информативность достигается при четырех опциях -v, --verbose .

Если у нас содержится в директории источника актуальная информация, то чтобы не засорять приемник информацией, которая в процессе работы была удалена или перемещена в источнике, нужно старые файлы и директории удалить. Для этого есть несколько опций удаления, каждая из которых предоставляет свой алгоритм удаления. Их аж шесть!
--del - сокращенная форма --delete-during ;
--delete - просто удалить посторонние файлы из приемника;
--delete-before - приемник удаляет перед передачей;
--delete-during - приемник удаляет в процессе передачи, но не перед;
--delete-delay - отложенное удаление/найти файлы для удаления в процессе передачи, но удалить после передачи;
--delete-after - приемник удаляет после передачи, но не перед ней;
--delete-excluded - так же удалить исключенные файлы в приемнике, для этого задается шаблон (--exclude=PATTERN).

Допустим у нас на приемнике есть более свежие файлы, и мы не хотим что бы они были перезаписаны старыми из источника, то для этого применяется ключ -u, --update .
-u, --update - пропустить файлы, если на приемнике файл новее.
Не стоит пугаться если изменились даты директорий, т.к. сами файлы небыли перезаписаны.

Порой файлы могут повредится или быть модифицырованы, но совпадать и датой и размером. То можно использовать проверку контрольной суммы, опция -c, --checksum .

Моей задачей было разобраться, как сделать резервную копию коллекций фотографий, музыки, наработок по университету и работе. При этом в источнике информация всегда актуальная, а то что удалено - мусор. Пример для решения моей задачи:
rsync -auvv --delete-during foobar_src/ foobar_dst/
Это обновит мой приемник, если он был уже чем то заполнен - вычистит то, чего нет в источнике, но не затронет файлы которые поновее, выведет статистику и состояние по каждому файлу.

Удаленная работа
Кроме того, очень полезным будет его способность работать через ssh. Что обеспечивает шифрование канала, что очень важно, если вы синхронизируете два сервера в сети интернет. Для уменьшение трафика, rsync так-же умеет сжимать данные, при передаче по сети.
Необходимы следующие опции:
-e - задать удаленный шелл для использования;
-z - сжимать передаваемые данные, либо задать:
-compress-level=9 - сжатие с установкой уровня компрессии.

Пример копирования с удаленного хоста по протоколу ssh:
rsync -avv --delete-during -compress-level=9 -e "ssh -p remote_ssh_port" user@host:/dir/to/foobar_src foobar_dst/
При этом, на стороне источника нужно иметь установленную утилиту rsync.

Надеюсь эта информация будет полезна многим. Больше информации про утилиту rsync вы сможете найти в ее же документации, благо она хорошо описана.
Там же вы можете найти информацию о том, как поднять дэмон rSync для непосредственного подключения без использования удаленного ssh шелла, а так же описание множества других опций на любой вкус и цвет.

Теги: rsync, копирование, резервирование файлов, синхронизация файлов

У замечательной и очень популярной программы rsync есть множество удобных опций и необычайных способностей, вот только их не так-то просто найти. Ну, если только вы не готовы прочитать весь мануал от корки до корки.

Попробую сберечь вам немного времени на чтение мануала и рассказать о самом важном и полезном. Простыми словами, как есть.

Зачем нужен rsync?

Зачем пользоваться rsync если есть привычные cp и scp , спросите вы.

    В одной части rsync удобней и лучше упомянутых аналогов потому что он дает вам возможность увидеть все что он сделает при копировании файлов до непосредственно операции копирования.

    В другой части - rsync по умолчанию копирует только новые и изменившиеся файлы, и даже не только файлы - а отдельные их части, делая это жестоко и эффективно.

Только этих двух причин достаточно чтобы в своей ежедневной работе забыть про cp , променяв эту команду и ее аналоги на rsync .

Принцип применения

Если мы говорим о простом копировании файлов, то первым делом всегда стоит сделать пробный прогон (ключ -n) в режиме с показом подробностей (-v):

rsync -avn source example.com:destination

В этом режиме rsync покажет список файлов, которые он скопирует. Будут скопированы только новые и изменившиеся файлы. Вы сможете убедиться что копируется сам каталог, а не содержимое, или что копируется именно содержимое.

После того как вы убедились что копируется именно то, что вы хотите, можно запускать самое настоящее копирование:

rsync -av source example.com:destination

В этой команде ключ -a подразумевает рекурсивное копирование всех файлов и каталогов включая их атрибуты, такие как дата создания и дата изменения. Ключ -v даст вам подробный отчет о работе по мере выполнения и по окончании.

Правила копирования каталогов

С одной стороны правила очень простые.

    Если в конце пути до именованного источника нет слеша, то скопируется сам каталог.

    $ rsync -avn path/to/source example.com:destination sending incremental file list source/ source/example.html ...

    Если слеш есть, или источник указывает на каталог без имени, то скопируется содержимое каталога.

    $ rsync -avn path/to/source/ example.com:destination ^^^ sending incremental file list example.html ... # Что эквивалентно такой команде: $ cd path/to/source; rsync -avn . example.com:destination

С другой стороны вполне можно в пылу забыть что и как, скопировав содержимое каталога вместо самого каталога , получив кучу хлопот с удалением лишних файлов, появившихся из ниоткуда с датами в прошлом (ключик -a , помните?).

Потому лучше всегда следовать обычному сценарию с предварительной проверкой операции.

Некоторые полезные ключи

Сначала поговорим об опциях которые вам будет здорово знать без шпор и шпаргалок.

    Ключ -P включает сразу несколько опций. С этим ключем rsync и покажет процесс копирования отдельных файлов, и продолжит копирование если оно было прервано. Особо эта опция пригождается при копировании больших файлов. Ключ -P нужно указывать каждый раз, иначе rsync удалит файлы которые не успели полностью закачаться.

    Если вы копируете файлы с какого-то очень занятого, или слабого, сервера, то можно исключить трату ресурсов процессора на вычисление изменившихся частей файлов, скопировав их целиком. Для этого нужен ключ -W .

    Если вам хочется знать сколько всего, по мнению rsync, осталось работать, вам нужен ключ --info=progress2 . Если вы копируете целую файловую систему, то этот ключ, будучи использован сам по себе, вас разочарует: информация об итоговом объёме будет постоянно обновляться. Это происходит потому что rsync не пытается считать всю файловую систему до того как начнёт копирование, а делает обе задачи сразу.

    Но не отчаивайтесь! Если вы хотите знать точно сколько осталось работать с самого начала, то можно отключить последовательное сканирование ключём --no-inc-recursive или, короче, --no-i-r .

    $ rsync -ah --partial --info=progress2 --no-i-r source example.com:destination 623.38M 0% 82.23MB/s 0:11:10

    Ключи выше есть начиная с версии 3.1.0, то есть уже работают в Debian stable.

    Если требуется не просто скопировать файлы, а полностью синхронизировать содержимое каталогов, удалив лишние файлы, при этом вам почему-то не с руки синхронизировать файлы с помощью Git , то пригодится ключ --delete (или эквивалентный ему --del).

    С этим ключём rsync удалит лишние файлы из каталого-назначения.

    $ rsync -avn --delete source example.com:destination sending incremental file list deleting source/bad.txt source/ source/test.txt

    Ключ -n в команде выше был оставлен намеренно.

О сжатии замолвим слово

Вопреки популярному заблуждению от использования сжатия внутри rsync (ключ -z) больше вреда, чем пользы. Дело в том что всюду используемый OpenSSH уже с версии конца 2005 года по-умолчанию использует сжатие передаваемых данных. Сами понимаете, сжатие уже сжатых данных только лишь использует ресурсы процессора, не уменьшая объем передаваемых данных.

В том, что при соединении с вашим сервером уже используется сжатие, можно убедиться так:

$ ssh -v [email protected] false 2>&1 | grep compression debug1: Enabling compression at level 6.

Если эта команда не покажет , в числе прочих, такую строчку про включение сжатия как выше, то может быть вам стоит использовать сжатие. Стоит проверить что от сжатия есть толк. Особенно это касается маломощных устройств с быстрым соединением: вашему NAS может быть быстрее скопировать что-то по гигабитному линку без сжатия, чем пытаться обогнать гигабитную сеть маломощным процессором.

К счастью, rsync достаточно умен чтобы не использовать сжатие если вы копируете файлы локально, из каталога на диск и т.п.

Копируем частично

Наверняка вам когда-нибудь понадобится чтобы rsync пропускал некоторые файлы при копировании.

В самом простейшем случае вам нужно чтобы rsync не копировал файлы разных систем контроля версий, включая каталог вроде.svn и.git . В этой задаче вам не нужно ничего кроме ключа -C (или --cvs-exclude в полной форме). Так файлы большинства популярных VCS будут проигнорированы будто их нет. Не забываем использовать -n при первом запуске.

rsync -nC example.com:source destination

Может получиться так что вы, по ошибке, скопируете кучу таких файлов от VCS. В этом случае для получения чистой копии вам пригодится ключ --delete-excluded , с которым все исключенные файлы будут удалены.

rsync -nC --delete-excluded example.com:source destination

Исключаем через.rsync-filter

Если нужные более гибкие правила, что особенно актуально если копирование делается регулярно, то лучше не мелочиться и оформить все исключения в файле.rsync-filter .

$ cat source/.rsync-filter - test.bin - *.tmp - /.cache - /example/ - /**/Trash/ - /.mozilla/firefox/*/Cache/ + Projects/**/Trash/

Для исключения чего-либо из списка на перенос нужно добавить в этот файл строчку с правилом (- или + в начале строки).

    Если нужно исключить конкретный файл, где бы он ни был в любом каталоге ниже по иерархии, то укажем просто имя файла.

    # никакой файл test.bin не будет скопирован - test.bin # все файлы.tmp будут пропущены - *.tmp

    Если нужно исключить файл или каталог относительно каталога в котором находится.rsync-filter , то укажем со слешем в начале:

    # не будет скопирован каталог или файл.cache, но будут скопированы foo/.cache и foo/bar/.cache - /.cache # не будет скопирован каталог example, но будет скопирован файл example - /example/

    В правилах звездочка соответствует любым символам кроме слеша, а две звездочки соответствуют вообще любым символам:

    # будут пропущены каталоги.local/share/Trash/ и Documents/example/Trash/ - /**/Trash/ # не будет пропущен каталог.mozilla/firefox/abcd.profile/ext/Cache/ # но будет пропущен каталог.mozilla/firefox/abcd.profile/Cache/ - /.mozilla/firefox/*/Cache/

    Наконец, если нужно чтобы какие-то файлы всё-таки копировались, не смотря на ранее заданные правила, то их можно отметить правилом + в начале строки.

    # каталог Projects/Example/layout/Trash/ будет скопирован + Projects/**/Trash/

Файлы.rsync-filter команда rsync умеет искать по всей структуре каталогов будучи запущена с ключём -F .

Если нужно чтобы сами эти файлы не копировались, то нужно указать этот ключ два раза так:

$ rsync -avFFn source example.com:destination sending incremental file list source/ source/example.html source/tmp/ source/tmp/foo.bin sent 174 bytes received 30 bytes 408.00 bytes/sec total size is 18,400 speedup is 90.20 (DRY RUN)

Как видите, лишние файлы не скопировались:

$ ls source/.rsync-filter source/foo.tmp source/foo.tmp source/.rsync-filter $ cat source/.rsync-filter - *.tmp

Ограничим rsync по ssh

Случается нужно разрешить работу rsync по ssh, удалённо и без пароля, только определённого для каталога и хоста, исключив копирование чего-либо в другие места или из других мест.

Например, вы хотите чтобы можно было скопировать файлы на сервер backup.example.com только с хоста server.example.com , только и только в каталог backup-example , и только с этими опциями:

$ rsync -aW --del source/ backup.example.com:destination/backup-example/

То сначала нужно получить команду, которую rsync выполняет при вызове ssh на удаленном хосте:

$ rsync -e "ssh -t -v" -aW --del source/ backup.example.com:destination/backup-example/ 2>&1 | grep command debug1: Sending command: rsync --server -lWogDtpre.iLsfxC --delete-during . destination/backup-example/

Соответственно, в ~/.ssh/authorized_keys на example.com следует добавить для известного ssh ключа запуск этой команды по-умолчанию при подключении:

from="server.example.com",command="rsync --server -lWogDtpre.iLsfxC --delete-during . destination/backup-example/",no-pty,no-port-forwarding ssh-rsa AAAA... # дальше ваш ключ

Таким образом, даже если при запуске rsync будут указаны какие-то другие опции, на сервере-назначении всё равно выполнится команда rsync соответствующая исходным, заданным вами, опциям и настройкам.

Если нужно чтобы ваш бекап нельзя было перезаписать или удалить на сервере назначения, то опцию --del следует заменить на --ignore-existing .

Машина времени

Те пользователи macOS и OS X, что делают бэкап, наверняка оценили работу Time Machine . Эта программа позволяет буквально в два клика вернуться к прошлой версии любого файла. Не смотря на все красивости, Time Machine не делает ничего такого чего мы не можем сделать с помощью rsync .

#!/bin/bash set -o nounset -o errexit cd $(dirname " $0 " ) date = $(date --iso-8601 = seconds) test -L latest || ln -s " $date " latest rsync --delete-excluded --prune-empty-dirs --archive -F --link-dest = ../latest " $@ " "./ $date " rm latest ln -s " $date " latest

Скрипт следует положить в корень того диска или каталога, куда следует делать бэкапы.

Запускать с указанием единственного аргумента: каталога с исходными файлами. Например, так.

/mnt/backups/backup /home

После нескольких запусков получается такая структура каталога:

2017-02-08T22:05:04+09:00 2017-02-08T22:10:05+09:00 2017-02-08T22:15:05+09:00 2017-02-08T22:20:06+09:00 2017-02-08T22:25:05+09:00 2017-02-08T22:30:04+09:00 latest -> 2017-02-08T22:30:04+09:00

При этом latest указывает на самый последний бэкап.

В каждом из каталогов содержится слепок того, что было в исходном каталоге в момент копирования. Можно подумать что и место на диске занято пропорционально количеству копий, однако это не так.

$ du -sh /mnt/backups 4,5M /mnt/backups $ du -sh /home 3,8M /home

Всё множество копий занимает лишь немного больше места чем исходный каталог. Место уходит на изменившиеся файлы.

Если ничего не менялось, то место всё равно расходуется на создание каталогов, которые нельзя хранить как жесткие ссылки .

$ du -hs 2017-02-08T22:20:06+09:00 2017-02-08T22:25:05+09:00 2017-02-08T22:30:04+09:00 3,8M 2017-02-08T22:20:06+09:00 136K 2017-02-08T22:25:05+09:00 136K 2017-02-08T22:30:04+09:00

Такая существенная экономия возможна благодаря упомянутым жестким ссылкам, которые rsync делает для файлов, не изменившихся с последнего копирования.

$ stat -c "%i" 2017-02-08*/example.txt | uniq 31819810

У одинаковых, не менявшихся, файлов будет один и тот же inode.

Конечно, по возможной экономии места на диске такому способу резервного копирования далеко до специальных программам, таких как

Потребность передачи файлов между серверами и компьютерами возникает довольно часто, особенно при администрировании нескольких устройств. Обычно для этих целей удобно использовать ssh и scp, но если файл очень большой, а изменена была только небольшая его часть, или вы хотите настроить постоянную автоматическую синхронизацию, то scp уже явно неидеальный вариант. Для этого существуют специальные утилиты. В этой статье мы рассмотрим одну из них. А именно будет рассмотрена rsync синхронизация в linux.

Rsync — это программное обеспечение с открытым исходным кодом, которое можно использовать для синхронизации файлов и папок с локального компьютера на удаленный и наоборот. Примечательная особенность Rsync — возможность передавать зашифрованные файлы с помощью SSH и SSL. Кроме того, здесь передача файлов выполняется в один поток, в отличие от других подобных программ, создающий отдельный поток для передачи каждого файла. Это увеличивает скорость и убирает дополнительные задержки, которые становятся проблемой при передаче большого количества маленьких файлов.

Возможно использование rsync для синхронизации файлов, каталогов, при этом может применяться сжатие и шифрование. Программа впервые была применена в июне 1996 года, она разработана Эндрю Тридгелом и Полом Маккеррасом. Rsync синхронизация выполняется по протоколу RSYNC, который специально разработан не просто для передачи файлов между двумя компьютерами, а для их синхронизации. Если точнее, то передается не файл полностью, а только то, что было изменено.

Как вы уже поняли, в этой статье мы рассмотрим rsync примеры синхронизации, настройку rsync, а также ее основные возможности и опции.

Особенности Rsync

Давайте сначала рассмотрим примечательные особенности Rsync:

  • Возможность поддерживать синхронизацию целых деревьев каталогов
  • Можно сохранять символические ссылки, жесткие ссылки, владельцев и права файла, метаданные и время создания.
  • Не требует особых привилегий
  • Передача файлов одним потоком
  • Поддержка RSH, SSH в качестве транспорта
  • Поддержка анонимного Rsync

Синтаксис Rsync

Мы не будем подробно останавливаться на установке этой утилиты в системе. Она очень популярна, поэтому вы можете установить ее с помощью своего пакетного менеджера из официальных репозиториев. В Ubuntu команда установки будет выглядеть вот так:

$ sudo apt-get install rsync

А теперь, уже по традиции подобных статей, рассмотрим синтаксис команды rsync:

$ rsync опции источник приемник

В качестве источника и приемника может выступать удаленная или локальная директория. Например, ssh, rsync, samba сервер или локальная директория. Опции задают дополнительные параметры rsync.

Опции Rsync

Теперь давайте кратко рассмотрим параметры rsync. Здесь перечислены не все опции. Для более подробной информации смотрите man rsync:

  • -v — Выводить подробную информацию о процессе копирования
  • -q — Минимум информации
  • -c — Проверка контрольных сумм для файлов
  • -a — Режим архивирования
  • -R — относительные пути
  • -b — создание резервной копии
  • -u — не перезаписывать более новые файлы
  • -l — копировать символьные ссылки
  • -L — копировать содержимое ссылок
  • -H — копировать жесткие ссылки
  • -p — сохранять права для файлов
  • -g — сохранять группу
  • -t — сохранять время модификации
  • -x — работать только в этой файловой системе
  • -e — использовать другой транспорт
  • -z — сжимать файлы перед передачей
  • —delete — удалять файлы которых нет в источнике
  • —exclude — исключить файлы по шаблону
  • —recursive — перебирать директории рекурсивно
  • —no-recursive — отключить рекурсию
  • —progress — выводить прогресс передачи файла
  • —stat — показать статистику передачи
  • —version — версия утилиты

Настройка сервера Rsync

Как вы понимаете, нельзя просто так взять и закинуть на первую попавшуюся машину файлы без установки на нее специального программного обеспечения. На удаленной машине должен быть установлен и настроен RSYNC, SSH, Samba или FTP сервер, с помощью которого Rsync сможет авторизоваться на машине и передавать туда файлы.

Рассмотрим минимальную настройку сервера rsync, для того чтобы могло быть выполнено rsync копирование файлов. Он позволит нам не только синхронизировать файлы на машину, но и получать и от туда.

Сначала создайте конфигурационный файл со следующим содержимым:

$ sudo nano /etc/rsyncd.conf

Path = /tmp/share/ hosts allow = 192.168.1.* hosts deny = * list = true uid = root gid = root read only = false

Здесь мы задаем путь к нашей папке для синхронизации, разрешаем доступ к серверу только с домашней сети (192.168.1.*) и запрещаем все остальные подключения. Параметры uid и gid указывают пользователя и группу, от которых будет запущен демон. Лучше не использовать root, а указать пользователя nobody и выдать ему права на ту папку, в которую будет выполняться rsync синхронизация каталогов.

$ sudo service rsyncd start

$ sudo service rsyncd enable

Примеры синхронизации Rsync

Копирование и синхронизация файлов на локальном компьютере

Rsync позволяет синхронизировать файлы и папки в пределах одной машины. Давайте сначала рассмотрим использование rsync для синхронизации файла на локальном компьютере:

$ rsync -zvh file /tmp/backups/

Синхронизация папок на локальной машине

Синхронизация папок rsync выполняется так же просто, как и файлов:

$ rsync -avzh /home/user/documents /tmp/backups/

Синхронизация с удаленным сервером

Ненамного сложнее синхронизировать файлы с удаленным сервером. Скопируем локальную папку documents, на удаленный сервер:

$ rsync -avz documents/ [email protected]:/home/

Также само можно синхронизировать файлы с rsync из удаленного сервера:

$ rsync -avz [email protected]:/home/ documents/

Адрес удаленного сервера записывается в таком формате:

имя_пользователя@адрес_машины:порт/папка/на/удаленной_машине

Порт указывать не обязательно, тогда rsync синхронизация папок будет выполняться на стандартном порту.

Синхронизация файлов по SSH

Чтобы задать протокол подключения используется опция -e. При использовании SSH все передаваемые данные шифруются и передаются по защищенному каналу, таким образом, чтобы никто не мог их перехватить.

Для использования SSH вам нужно знать пароль пользователя в системе.

Синхронизация файлов rsync с удаленного сервера по ssh будет выглядеть вот так:

$ rsync -avzhe ssh [email protected]:/root/install.log /tmp/

А теперь передадим данные на тот же сервер:

$ rsync -avzhe ssh backup.tar [email protected]:/backups/

Просмотр прогресса при синхронизации

Для просмотра прогресса копирования файла с одной машины на другую используется опция progress:

$ rsync -avzhe ssh --progress /home/user/documents [email protected]:/root/documents

Синхронизация не всех файлов в rsync

Опции include и exclude позволяют указать какие файлы нужно синхронизировать, а какие исключить. Опции работают не только с файлами но и с директориями.

Например, скопируем все файлы, начинающиеся на букву R:

$ rsync -avze ssh --include "R*" --exclude "*" [email protected]:/root/documents/ /root/documents

Удаление при синхронизации

Во время синхронизации можно удалять файлы, которых нет на машине откуда идет rsync синхронизация, для этого используется опция —delete.

Например:

$ rsync -avz --delete [email protected]:/documents/ /tmp/documents/

Если перед выполнением этой команды создать в папке файл которого нет на удаленном сервере, то он будет удален.

Максимальный размер файлов

Вы можете указать максимальный размер файлов, которые нужно синхронизировать. Для этого используется опция —max-size. Например, будем синхронизировать только файлы меньше 200 килобайт:

$ rsync -avzhe ssh --max-size="200k" /user/documents/ [email protected]:/root/documents

Удаление исходных файлов

Есть возможность удалять исходные файлы после завершения синхронизации с удаленным сервером:

$ rsync --remove-source-files -zvh backup.tar /tmp/backups/

Таким образом, файл backup.tar будет удален после завершения копирования в папку /tmp/backups.

rsync ... SRC [SRC ]... DEST rsync ... SRC [SRC ]... HOST:DEST rsync ... SRC [SRC ]... HOST ::DEST rsync ... SRC [SRC ]... rsync://HOST [:PORT ]/DEST rsync ... SRC rsync ... HOST:SRC [DEST ] rsync ... HOST::SRC [DEST ] rsync ... rsync://HOST[:PORT ]/SRC [DEST ]

Описание

rsync - программа, похожая на rcp, но более гибкая и использует протокол remote-update значительно увеличивающий скорость передачи файлов. Данный протокол позволяет передавать по сети только различия между двумя наборами файлов, используя при этом алгоритм проверки контрольных сумм.

Возможности программы:

  • поддержка копирования ссылок, устройств, владельцев, групп и прав доступа к файлам;
  • использовать функции, аналогичные tar в графической оболочке;
  • режим, игнорирующий CVS файлы;
  • возможность использования удаленных консольных соединений ssh и rsh;
  • не требует привилегий суперпользователя (root);
  • конвейерная передача данных, уменьшающая время синхронизации
  • поддержка анонимного копирования с помощью демонов, что позволяет создавать автоматические "зеркала" данных.

Rsync позволяет сделать синхронизации с локального компьютера на удаленный и наоборот, но не поддерживает синхронизации между двумя удаленными компьютерами.

Существует два варианта связи с удаленным компьютером, это использование rcync-демона а в этом случае связь идет напрямую, через протокол TCP и соединение с помощью дистанционного терминального соединения, такого как ssh.

Для указания типа соединения с узлом используется символ двоеточия ":", если оно использовано один раз перед именем узла, то это будет соединение через ssh. При использовании демона, двоеточие указывается дважды или адрес узла задается в виде rsync://имяузла.

Если не указать компьютер источник или получатель тогда, вместо пропущенного, будет использован локальный компьютер.

Необходимо помнить, что rsync должен быть установлен и на компьютере получателе и отправителе.

Возможно использование rsync и в случае, когда источник и получатель находятся на одном компьютере. В этом случае утилита работает как улучшенная команда копирования.

Примеры:

Перенести все файлы, совпадающие с шаблоном *.c из текущей папки на компьютер foo в папку scr. При этом если на удаленном компьютере существуют файлы с такими именами, то будут передаваться только изменения, а не файлы целиком.

Rsync -t *.c foo:src/

Перенести все файлы из папки src/bar, включая подпапки и их содержимое с компьютера foo в папку /data/tmp/bar на локальном компьютере. При этом при переносе будет использован режим сжатия данных и "архивный" режим, позволяющий сохранить символьные ссылки, права, атрибуты, владельцев.

Rsync -avz foo:src/bar /data/tmp

Слэш в конце указания пути источника данных позволяет изменить поведение команды и не создавать новую подпапку на компьютере получателе, например две следующие команды выполняют одинаковое действие:

Rsync -av /src/foo /dest rsync -av /src/foo/ /dest/foo

Скопировать файлы file1 и file2 с помощью демона на локальный компьютер в папку /dest. Каждый добавленный файл или папка источник должен содержать /modname/ и перед ним должен быть пробел. Все остальные пробелы считаются частью имени файла.

Rsync host::"modname/dir1/file1 modname/dir2/file2" /dest

Скопировать файлы file1 и file2 на локальный компьютер в папку /dest с помощью дистанционного подключения к оболочке bash. Обработка имен файлов происходит на удаленном компьютере и возможна ситуация, когда удаленный компьютер неправильно обработает пробелы (очень редко).

Rsync -av host:"dir1/file1 dir2/file2" /dest

В случае если имя файла содержит пробелы можно использовать обратный слэш для их указания или маску или шаблон для пробелов, например:

Rsync -av host:"file\ name\ with\ spaces" /dest rsync -av host:file?name?with?spaces /dest

Работа через демона

Прямое подключение к rsync демону обычно происходит через 873 TCP порт и необходимо, чтобы он был запущен для приема на удаленном компьютере. Работа через демона аналогична работе через оболочку bash за исключением:

  • Необходимо использование двух символов "::" для разделения имени компьютера (хоста) и пути или указание в виде rsync://имяузла.
  • первое слово в "пути" это имя модуля.
  • удаленный демон может вывести сообщение о моменте подключения
  • если не указать путь на удаленном компьютере, то будет показан список доступных путей
  • нельзя использовать параметры, предназначенные для режима --rsh

Например, копировать все файлы, доступные удаленному модулю с именем src.

Rsync -av host::src /dest

Некоторые модули могут потребовать авторизации, в этом случае будет запрошен пароль. При написании скрипта процедуру авторизации можно выполнить автоматически, задав значение пароля в глобальной переменной RSYNC_PASSWORD или в параметре --password-file. Но при этом нужно помнить, что в некоторых версиях операционных систем, значения глобальных переменных видны всем пользователям и в этих системах правильнее будет использование параметра --password-file.

Возможно подключение через прокси сервер с помощью установки значения переменной в оболочке bash RSYNC_PROXY. При этом необходимо проверить, что конфигурация web proxy поддерживает соединения через порт 873.

Иногда полезно использовать возможности демона при соединении по ssh. Такой режим полезен, например, для шифровки передачи данных. С точки зрения пользователя синтаксис команды передачи данных с помощью демона через удаленное sh соединение практически не отличается от обычного соединения с помощью демона. За исключением необходимости явного указания соединения через rsh в командной строке с помощью параметра --rsh=КОМАНДА . (Переменная bash RSYNC_RSH в данном случае не может быть применена). Например:

Rsync -av --rsh=ssh host::module /dest

В случае если необходимо использование другого пользователя удаленного компьютера, то нужно учитывать, что Пользователь, указанный перед символом @ указывает на имя пользователя модуля rsync, а не компьютера. А пользователь ssh указывается с помощью параметра -l например:

Rsync -av -e "ssh -l ssh-user1" rsync-user2@host::module /dest

Где user1 - это пользователь ssh, а user2 пользователь для доступа к модулю, если это требуется.

Запуск rsync-демона для приема соединений.

Для того чтобы было возможно соединение с помощью демона, он должен быть запущен на удаленном компьютере. Процедура запуска и настройки демона описана в описании rsyncd.conf (5) . При использовании --rsh ручной запуск не требуется.

Параметры rsync

Многие параметры команды имеют длинное и короткое написание, некоторые имеют только "длинный" вариант. Для установки значения после параметра необходимо использовать конструкцию "=Значение".

Краткое Длинное написание Описание параметра
--help Напечатать описание параметров и выйти
-version Показать версию программы
-v --verbose Подробный режим. Увеличивает объем информации, показываемый во время передачи данных. Однократное использование -v дает информацию о времени передачи и краткое резюме в конце. Двойное использование -v дополнительно сообщит о пропущенных файлах и дополнительную информацию о передаче. Использование большего количества -v возможно только во время отладки.
-q --quiet Этот параметр уменьшает объем диагностической информации о передаче данных. Полезен при синхронизации по расписанию, с помощью CRON .
--no-motd Подавляет вывод информации при запуске передачи с помощью демона. И запрещает выводить список доступных модулей при команде "rsync host::"
-I --ignore-times Обычно rsync не синхронизирует файлы, имеющие одинаковый размер и время редактирования. Этот параметр отключает "быструю проверку" изменений и требует полного копирования.
--size-only В случае применения данного параметра файлы, имеющие одинаковый размер на источнике и получателе не будут переноситься независимо от времени их создания и изменения.
--modify-window При сравнении двух дат rsync будет считать даты равными, если они будут отклоняться на значение меньшее, чем задано в данном параметре. Например, при обмене файлами с накопителем в формате MS FAT желательно установить временной интервал в 2 секунды (--modify-window=2).
--checksum Это параметр заставляет отправителя передать контрольные суммы каждого файла (128-бит MD4 CRC). Это происходит в начале сканирования файловой системы, при построении списка доступных файлов, и используется для проверки изменений файлов на приемнике (в том случае если размер и метки времени совпадают). Так как требуется вычисление контрольных сумм на обоих компьютерах, то данная процедура может значительно замедлить процесс обмена данными.
При этом необходимо знать, что rsync всегда проверяет полученные файлы на правильность их восстановления с получением итоговой контрольной суммы всего файла. Но данная процедура не имеет ничего общего с расчетом контрольных сумм для определения изменений в файле.
-a --archive Данный параметр аналогичен группе параметров -rlptgoD . Это простой способ сказать, что необходимо сохранить почти все включая подпапки. Для сохранения жестких ссылок необходимо добавить параметр -x .
--no-OPTION С помощью префикса --no указанного перед параметром его действие можно отключить. К сожалению, не все параметры можно отключить данным способом. Можно использовать для отключения как коротких, так и длинных параметров, например: --no-R или --no-relative .
Так же можно отключить какой-либо параметр в составном ключе. Так можно в параметре -a, состоящего из -rlptgoD отключить -o:
-a --no-o или -a --no-owner .
При использовании --no необходимо учитывать, что существуют позиционные параметры, в которых учитывается последний параметр и непозиционные.
-r --recursive Рекурсивное копирование, включая подпапки. Дополнительно смотреть в команде -d --dirs .
-R --relative Использование относительных путей. Наглядно это видно на примере команды:
rsync -av /foo/bar/baz.c remote:/tmp/ В данном случае файл baz.c будет скопирован в папку /tmp/, а в случае команды:
rsync -avR /foo/bar/baz.c remote:/tmp/ файл будет скопирован в папку /tmp/foo/bar/
Начиная с версии 2.6.7 в путь можно вставить символы "./", которые отменят создание папок до символа точки, например команда:
rsync -avR /foo/./bar/baz.c remote:/tmp/ создаст на получателе файл /tmp/bar/baz.c
--no-implied-dirs Параметр влияет на работу параметра -R --relative . В этом случае атрибуты исходных каталогов не передаются, существующие папки не меняют свои атрибуты, а новые папки создаются с атрибутами по умолчанию
-b --backup Если уже существуют аналогичные файлы в папке назначения, то они будут переименованы, перенесены в другую папку или удалены. Можно указать папку для архива с помощью --backup-dir или задать суффикс с помощью --suffix .
--delete-excluded
--backup-dir=DIR Совместно с -b указывает на папку, куда будут архивироваться старые версии файлов на принимающей стороне. Это может быть использовано для послойных архивов. Также возможно использование параметра -suffix.
--suffix=SUFFIX Используется совместно с -b. Переопределяет суффикс по умолчанию для архивных копий заменяемых файлов. Если не указан каталог архивирования, то по умолчанию суффикс "~", иначе пустая строка.
-u --update Если файл на принимающей стороне свежее файла из источника, то он будет пропущен. Если метки времени файлов совпадают, а их размеры не, то файл будет заменен.
--inplace В этом случае rsync не будет создавать при копировании новый файл и затем им замещать старый, а сразу начнет перезапись старого файла. Такой алгоритм не сможет сохранить целостность файла в случае сбоя соединения между компьютерами, за исключением использования совместно с параметром --backup.
Этот параметр полезен в случае копирования файлов на одном компьютере или при копировании больших файлов с изменениями на уровне блоков или добавленными в конец файла данными.
Параметр включает в себя --partial (обрыв соединения не приводит к удалению файла), но конфликтует с --partial-dir и --delay-updates
--append Данный параметр принуждает rsync добавлять данные в конец файла, предполагает, что начало файлов идентичное. В случае из различия происходит сбой при проверке контрольной суммы файла и полное обновление как у --inplace. Передаются только те файлы, которые короче отправляемых и новые файлы.
-d --dirs Копировать каталоги, которые встречаются. В отличие от --recursive игнорируются каталоги, начинающиеся с точки "." или заканчивающиеся косой чертой "/", например ".", "dir/." или "dir/". При совместном использовании параметр --recursive имеет приоритет перед этим параметром.
-l --links Если встречается символическая ссылка, то воссоздавать ее на файл, указываемый исходной ссылкой.
-L --copy-links Если встречается символическая ссылка, то копировать файл, на который она указывает, а не ссылку. В старых версиях работа данного параметра несколько отличалась от современных версий.
--copy-unsafe-links Указывает утилите, что необходимо копировать файлы вне копируемого дерева, если на них ведут символические ссылки. Параметр не дает никакого эффекта, если указан --copy-links.
--safe-links Указывает утилите, что нельзя копировать файлы вне копируемого дерева, если туда указывают символические ссылки. Использование данного параметра совместно с --relative может дать непредсказуемые результаты.
--copy-dirlinks Данный параметр говорит отправляющей стороне обрабатывать символические ссылки на папки, как будто это реальный каталог. Это полезно если вы не хотите копировать файлы, на которые указывают символические ссылки, но хотите скопировать дерево папок.
--keep-dirlinks Принимающая сторона обрабатывает символическую ссылку на каталог, если она указывает на реальный каталог у отправителя.

Предположим, что идет перенос каталога "foo" и в нем есть файл "file", но реально "foo" это символическая ссылка на каталог "bar". Без данного параметра ссылка "foo" будет удалена, будет создан полноценный каталог "foo" и в него будет занесен "file", с параметром файл "file" будет перенесен в "bar"

-H --hard-links Говорит rsync рассматривать жесткие ссылки и связывать воедино их соответствующими файлами на принимающей стороне. Без этого жесткие ссылки рассматриваются как отдельные файлы. Работает только, если в передаче участвует и жесткая ссылка и сам файл.
-p --perms Устанавливать права доступа к файлу на принимающей стороне такие же, как и у исходного файла. (Дополнительно управление правами может задаваться параметром --chmod). Если параметр выключен, то права устанавливаются следующим образом:
  • Существующие файлы, в том числе и обновляемые не меняют прав доступа к ним (параметр --executability может менять выполняемость).
  • Новые файлы получают "нормальные" значения прав от исходного файла с учетом настроек umask, за исключением случаев, когда каталог наследует права родительского каталога.
Таким образом, когда отключены --perms и --executability утилита обрабатывает права доступа аналогично другим командам копирования, таким как cp и tar
--executability С помощью этого параметра при копировании сохраняется выполняемость или неисполнимость файла. Если в правах доступа файла источника включен хоть один бит "исполнимости" то сам файл считается исполняемым. Если конечный файл отличается по "исполнимости" от исходного, то утилита изменяет права доступа следующим образом:
  • Если новый файл считается "неисполняемым", то будут отключены все признаки "x" в конечном файле
  • Если исходный файл "исполняемый", то в конечном файле признаки исполнимости будут включены в тех правах, где он доступен для чтения.
Если --perm включена, данный параметр игнорируется.
--chmod Указывает rsync применить заданные права доступа, выраженные в строковом виде. Данные права будут рассматривать как права исходного файла, но она не влияет на уже существующие файлы (если не использован параметр --perm ).
Дополнительно к правилам построения прав команды chmod в строке можно указать применение правил к каталогу, указав "D" или к файлу "F":
--chmod=Dg+s,ug+w,Fo-w,+X
Возможно указание нескольких параметров --chmod они просто добавляются к списку изменений.
-o -owner Установить владельца конечного файла того же, что у исходного, но только в том случае если команда выполняется суперпользователем (смотреть команду sudo). Иначе владельцем файла будет пользователь запустивший утилиту на принимающей стороне.
Как правило, владелец идентифицируется по имени, но иногда по ID.
-g --group При запуске от имени суперпользователя, сохранять группу владельцев файла при копировании, иначе группа будет установлена по группе принимающей стороны. Обычно идентификация производится по имени, а не по ID.
--devices Переносить символьные и блочные устройства с воссозданием этих устройств на получателе. Не работает, если утилита не запущена от имени суперпользователя и нет параметра --super.
--specials Переносить специальные файлы, такие как socket и FIFO.
-D Параметр эквивалентен параметрам --devices --specials
-t --times Передавать время последнего изменения файла и обновлять его на удаленной системе. Если не использовать данный параметр, то последующее копирование с параметром -i вызовет повторное обновление неизененных файлов. Хотя алгоритм обновлений rsync достаточно эффективен все равно лучше использовать данный ключ.
--omit-dir-times Пропускать каталоги при синхронизации времени изменений (параметр --times ). Желательно использовать если файлы копируются на NFS диски.
--super Принуждает принимающую сторону попытаться работать с правами суперпользователя, даже если принимающий модуль не был запущен с такими правами. Эти действия включают в себя сохранение пользователей (смотреть --owners ), групп владельцев (--groups ) и копирование устройств (--devices ).
-S --sparse Использовать файлы образов для хранения скопированных фалов. Конфликтует с --inplace , так как невозможно переписать файлы в образе.
Не использовать в файловой системе Solaris "tmpfs".
-n --dry-run Сообщить о файлах, которые необходимо скопировать, но не копировать их.
-W --whole-file Не использовать передачу файла по частям. Если исходные файлы и получатели находятся на локальных дисках, то данный параметр используется по умолчанию. Имеет смысл его использовать, когда скорость передачи по каналу выше, чем скорость работы диска.
-x --one-file-system Не переходить не другую файловую систему во время рекурсии. При этом можно указать в команде файлы из разных файловых систем.
--existing,
--ignore-non-existing
Копировать только существующие файлы. То есть если файла или каталога получателя нет, то файл не будет создан. В сочетании с --ignore-existing никакие файлы не будут обновлены. Это может быть полезно для удаления лишних файлов.
--ignore-existing Пропускать файлы, которые уже существуют на получателе.
--remove-source-files Удалять исходные файлы (не каталоги), которые уже успешно скопированы.
--delete При синхронизации каталогов rsync будет удалять файлы в каталоге-получателе, если их нет на отправителе. Файлы, исключенные из передачи удаляться не будут, так же не будут удалены файлы, заданные по параметру --delete-excluded . В версиях младше 2.6.7 данный параметр не работает.
При неправильном использовании данный параметр может быть опасен, имеет смысл предварительно проверить, что будет удалено с помощью параметра --dry-run .
В случае возникновения ошибки ввода-вывода удаление файлов будет автоматически отменено, если не использован ключ --ignore-errors .
Параметр может комбинироваться с --delete-WHEN и -delete-excluded , однако если вместе с --delete-WHEN не будут заданы дополнительные параметры, то она будет работать как --delete-before.
--delete-before Запрашивает удаление файлов на принимающем диске до начала передачи файлов. Если указаны --delete или --delete-exclude без --delete-WHEN , то это параметр по умолчанию.
Использование данного ключа полезно, если мало места на диске-получателе и для копирования необходимо предварительно его освободить.
-delete-during, --del Удаление файлов будет постепенным в процессе передачи файлов. Это быстрее, чем --delete-before или --delete-tranfer , но работает начиная с версии 2.6.4. Под удалением понимается работа параметра --delete .
--delete-after Запрос на удаление файла будет сделан после завершения передачи.
--delete-excluded Исключить из удаления файлы на принимающей стороне, указанные согласно правилам фильтрации. Используется совместно с --delete .
--ignore-errors Продолжать работу и удалять файлы, даже при наличии ошибок ввода-вывода. Используется совместно с --delete .
--force Если полное имя файла источника совпадает с именем каталога на приемнике, то каталог должен быть удален и заменен на файл, даже если он непустой. Не работает вместе с --delete .
--max-delete=NUM Не удалять больше чем NUM файлов. Полезно при синхронизации больших деревьев каталогов, для предотвращения сбоя. NUM не может быть меньше 1.
--max-size=SIZE Не копировать файлы, размер которых превышает SIZE . Можно использовать суффиксы для указания размера: "K" или "KiB" (1024 байт), "M" или "MiB" (1024 байт *1024), "G" или "GiB" (1024 байт *1024 *1024). Если вам удобнее умножать на 1000 то суффиксы будут "KB", "MB", "GB". регистр символов в суффиксе значения не имеет. После суффикса можно добавить символы "+1" или "-1", что изменит значение на один байт в ту или иную сторону. Например:
--max-size=1.5mb-1 это 1499999 байт
--max-size=2g+1 это 2147483649 байт.
--min-size=SIZE Не передавать файлы размером меньше указанных в SIZE . Размеры указываются аналогично --max-size .
-B --block-size=BLOCKSIZE Задает фиксированный размер блоков для алгоритма rsync . Обычно он меняется в зависимости от размера файла.
-e --rsh=COMMAND Данный параметр позволяет выбрать альтернативную программу для соединения с удаленным компьютером. По умолчанию используется ssh, но его можно изменить, например на rsh. При использовании совместно с host::module/path, заданная программа будет использована для запуска rsync демона на удаленном хосте и через это соединение будут передаваться данные, а не через прямое подключение сокета.
Программа для удаленной связи так же может быть назначена с помощью переменной среды RSYNC_RSH, которая должна иметь значения, как и при описании -e . Примеры задания параметра:

E "ssh -p 2234"

E "ssh -o "ProxyCommand nohup ssh firewall nc -w1 %h %p""

--rsync-path=PROGRAM Указать программу, которая будет использована на удаленном компьютере для запуска rsync. Используется в случае, если путь к rsync не описана в глобальной переменной path на удаленном компьютере, например
--rsync-path=/usr/local/bin/rsync
rsync -avR --rsync-path="cd /a/b && rsync" hst:c/d /e/
-C --cvs-exclude Применение данного параметра полезно если необходимо исключать из переноса большое количество разнообразных файлов. Для фильтра используется механизм аналогичный CVS файлам. Например, сначала инициализируется следующий список:

RCS SCCS CVS CVS.adm RCSLOG cvslog.* tags TAGS .make.state .nse_depinfo *~ #* .#* ,* _$* *$ *.old *.bak *.BAK *.orig *.rej .del-* *.a *.olb *.o *.obj *.so *.exe *.Z *.elc *.ln core .svn/
Пото к нему добавляется список из файла $HOME/.cvsignore, затем значения глобальной переменной CVSIGNORE. (имена игнорируемых файлов разделяются пробелами).
Также если в копируемом каталоге есть файл.cvsignore будут проигнорированы файлы из этого каталога совпадающие с шаблоном содержащийся в файле. Подробнее смотреть команду cvs(1).

-f --filter=RULE Исключить файлы, заданные в RULE из списка копируемых. Полезно при использовании рекурсивного копирования. Параметр может быть использован несколько раз в одной команде. Правила фильтрации описаны ниже.
--filter="dir-merge /.rsync-filter"
-F Является сокращением для повторного использования параметра --filter .
--exclude=PATTERN Упрощенный вариант параметра --filter.
--exclude-from=FILE Аналогично параметру --exclude , но FILE указывает на файл, который содержит шаблоны исключения (по одному в строке). Игнорируются пустые строки и строки, начинающиеся на символы ";" и "#". Если вместо имени файла указать дефис, то данные для фильтра будут взяты из стандартного ввода.
--include=PATTERN Функция, противоположная параметру --filter . Шаблон PATTERN указывает на файлы, которые должны быть скопированы. Подробнее в Правилах фильтрации.
--include-from=FILE Функция аналогичная --include , ни использующая шаблоны для создания списка копируемых файлов из файла FILE . Игнорируются пустые строки и строки начинающиеся на символы ";" и "#". Если вместо имени файла указать дефис, то данные для фильтра будут взяты из стандартного ввода.
--files-from=FILE Данный параметр позволяет точно указать, какие файлы должны быть скопированы. Список файлов читается из файла FILE или из стандартного ввода, если указать дефис "-". Данный параметр существенно влияет на работу rsync с другими параметрами:
  • Совместно с --relative (-R), сохраняет информацию о пути для каждого элемента в файле FILE . Для отключения укажите --no-relative или --no-R.
  • Совместно с --dirs (-d) создает папки указанные в списке, вместо того, чтобы пропустить их. Для отключения использовать --no-dirs или --no-d.
  • --archive (-a) не вызывает рекурсию, поэтому если необходима рекурсия, укажите -r или --recursive.
  • Место нахождения параметра --files-from не влияет на изменение работы rsync - она влияет на работу данных параметров с любого места в командной строке.
Пути к файлам указанных в FILE задаются относительно исходного каталога, а не корня тома.
rsync -a --files-from=/tmp/foo /usr remote:/backup Если /tmp/foo содержит строку "bin" или "/bin" на удаленном хосте будет создан /backup/bin.
Если перед именем FILE указать "host:" или просто ":", то он может быть прочитан с удаленного хоста, например:
rsync -a --files-from=:/path/file-list src:/ /tmp/copy Файл /path/file-list будет прочитан с удаленного компьютера src.
-0 --from0 Сообщает утилите, что файлы содержащие файлы или правила заканчиваются нулевой символ ("\0") а не символы перевода строки, возврата каретки и т.п. Влияет на --exclude-from, --include-from, --files-from и на соединение файлов в параметре --filter . Не влияет на --cvs-exclude .
-T --temp-dir=DIR Задает временный каталог DIR для файлов на принимающей стороне. По умолчанию временные файлы создаются там же, где должен будет находиться принимаемый файл.
Часто используется при передаче раздела диска, когда на диске для приема файлов может не хватить места. Если DIR расположен на другом томе, то после копирования rsync будет вынуждена сделать еще одно копирование, а не переименование файлов.
Если параметр используется по другим причинам, кроме как в случаях недостаточности места на диске, то его можно комбинировать с --delay-updates . Она обеспечивает помещение скопированных файлов в целевые каталоги после завершения передачи данных.
-y --fuzzy Если файл на в каталоге назначения rsync будет искать в этом каталоге файл, совпадающий по размерам, дате изменения или имени. Если такой файл существует, то утилита использует его для ускорения передачи данных. Использование ключа --delete может стереть все потенциально подходящие файлы до начала обмена, поэтому при совместном использовании лучше использовать параметр --delete-after .
--compare-dest=DIR Дополнительно сравнивать файлы с каталогом DIR . Если файл отсутствует в целевом каталоге, но есть в папке DIR он не будет передаваться.
Начиная с версии 2.6.4 можно указывать данный параметр несколько раз.
--copy-dest=DIR Аналогично --compare-dest , но при этом будет сделана копия совпадающих с передаваемыми файлами в папке DIR в каталог назначения. Это удобно если копия делается в новое место и сокращает трафики и время копирования. Начиная с версии 2.6.4 можно указывать данный параметр несколько раз.
--link-dest=DIR Данный параметр ведет себя подобно --copy-dest, но вместо копирования папку назначения там будут созданы жесткие ссылки. Файлы должны быть одинаковыми, в том числе и по атрибутам (права доступа, владельцы). rsync-av - --link-dest=$PWD/prior_dir host:src_dir/ new_dir/

Начиная с версии 2.6.4 можно указывать данный параметр несколько раз.

-z --compress Сжимать данные перед отправкой. Степень сжатия будет ниже, чем обычными архиваторами, так как требуется сравнение блоков и многие другие данные.
--compress-level=NUM Установить уровень сжатия, отличный от уровня по умолчанию. Для сжатия NUM должно быть больше 0.
--numeric-ids Передавать не имена пользователей и групп, а их ID и сравнивать по ним. По умолчанию rsync использует имена владельцев файлов и имена групп.
Если на принимающей стороне пользователя (группы) с таким ID не существует, то ID будет использован и в качестве имени.
--address IP адрес для соединения с rsync демоном.
--port=PORT Задает альтернативный номер порта взамен стандартного 873.
--sockopts Позволяет установить всевозможные опции сокета для управления передачей данных. По умолчанию никаких специальных параметров не устанавливается и влияет только на прямой сокет соединения с удаленным rsync демоном.
--blocking-io Использовать блокировку ввода-вывода при запуске удаленной командной среды. Если это rsh, remsh или rsync, то этот параметр будет использован по умолчанию.
-i --itemize-changes Запрашивает простой подробный список изменений для каждого измененного файла, включая изменения атрибутов. Аналогично параметру --out-format="%i %n%L" . Если указат параметр дважды, то будет выведен и список неизмененных файлов (расширенную информацию можно получить и используя параметр -vv)
Подстановочный символ "%i" создает кодированный вывод из 9 букв. Общий формат выглядит как строка формата YXcstpogz, где Y замещается типом обновления, X - тип файла, остальные символы указывают на измененные атрибуты.
Тип обновления Y может быть следующим:
  • < файл передается на удаленный сервер
  • > файл передается на локальный компьютер
  • c локальное изменение(создание каталога или символической ссылки)
  • h изменение жесткой ссылки
  • . файл не обновлялся, хотя у него могли измениться атрибуты.

Тип файлов X может быть заменен на: f - файл; d - каталог; L - символическая ссылка; D- устройство; S -специальный тип файла (например: socket или fifo).
Остальные символы строки могут быть выведены, если были изменены связанные с ними атрибуты файлы. (существуют некоторые исключения).
Следующие буквы связаны с атрибутами файлов:

  • c - контрольная сумма файлов отличается и будет обновлена передачей файла (необходим параметр --checksum).
  • s - размер файлов не совпадает и будет произведена передача файла
  • t - время последнего изменения файлов отличается (требует --times).
  • p - отличаются права доступа к файлам (требует --perms).
  • o - отличаются владельцы файла, будет обновлено на владельца отправителя (требует --owner и прав супер-пользователя).
  • g -группы владельцев разные и требуется обновление на группы отправителя (необходим параметр --group и права супер-пользователя).
  • z -символ зарезервирован для будущих версий rsync.
Возможен вывод других символов, в случае удаления файла будет выведено "deleting"
--out-format=FORMAT Данный параметр позволяет точно определить, какая информация будет выведена после копирования файлов. Строка FORMAT представляет собой последовательность символов начинающихся с приставки в виде символа %. Список возможных параметров описан в разделе "log format".
При выводе будет упомянут каждый файл, который был изменен в процессе копирования.
--log-file=FILE Параметр определяет файл, в который будет занесен протокол работы программы. Это похоже на работу ведения журнала демоном rsync, однако в данном случае журнал может находиться на клиентском компьютере или на отдающем компьютере без работы демона. Данная функция полезна для анализа работы в случаях аварийного завершения утилиты. По умолчанию строка формата выводимой информации имеет вид: "%i %n%L", но она может быть переопределена в параметре --log-file-format.
Пример:
rsync -av --rsync-path="rsync --log-file=/tmp/rlog" src/ dest/ Данная команда сохраняет файл журнала на серверной стороне.
--log-file-format=FORMAT Позволяет указать, какая информация будет помещена в файл журнала. Список символов подстановки вместо FORMAT описан в разделе "log format"
--stats Говорит утилите о необходимости вывести подробную статистику о передаче файлов, с целью подобрать оптимальный алгоритм копирования данных.
Статистика содержит следующую информацию:
  • Общее количество файлов (включая каталоги, ссылки, специальные файлы)
  • Количество передаваемых обычных файлов, не включая создаваемые каталоги, ссылки и т.п.
  • Общий размер файла и сумма размеров всех передаваемых файлов. Размер каталогов и специальных файлов не учитывается, символические ссылки учитываются.
  • Суммарный размер всех передаваемых файлов
  • Символьные данные сколько данных пришлось отправить получателю для сравнения файлов и для воссоздания файлов.
  • Данные сопоставления, сколько приемник данных для воссоздания файлов
  • Список размеров файлов, если отправитель направлял его получателю.
  • Время, затрачиваемое на создание списка файлов.
  • Время, затраченное на передачу списка файлов получателю
  • Общее количество переданных байт посланных на стороне клиента и на стороне сервера
  • Размер всех данных non-message в байтах.
-8 --8-bit-output Не проверять на соответствие настройкам локализации и сохранять старшие биты в байтах.
-h --human-readable Выводить числа в человекочитаемом виде. Большие числа будут иметь суффиксы K (1000), M (1000*1000) и G (1000*1000*1000). Если не использовать данный параметр, то базой будет 1024.
--partial По умолчанию в случае разрыва связи или внезапного прекращения передачи rsync удаляет частично переданные файлы. Данный параметр сохраняет их с целью сокращения передачи пра повторной передаче.
--partial-dir=DIR В случае если используется параметр --partial имеет смысл указать каталог, где будут находиться файлы переданные частично.
Данный каталог будет создан, если он не существует.
Каталог не должен быть доступен для записи другими пользователями.
Имя каталога можно задать переменной среды bash RSYNC_PARTIAL_DIR, но он будет работать только при указании параметра --partial .
--delay-updates Данный параметр принуждает создавать временный файл для каждого обновляемого файла, пока не будет закончена передача после окончания которой, все переданные файлы будут переименованы. По умолчанию все файлы помещаются в папку ".~tmp~" в каталоге назначения. Но каталог для временных файлов может быть переназначен параметром -partial-dir. Параметр конфликтует с --inplace и --append.
Использование данного параметра требует дополнительного места на накопителе получателя, так как будут созданы копии всех копируемых файлов. Нельзя использовать абсолютный путь при при указании в --partial-dir, в этом случае файлы с одинаковыми именами будут перезаписаны.
-m -prune-empty-dirs Не создавать пустых каталогов. Если при рекурсивном копировании иерархии будут обнаружены каталоги, из которых нет необходимости копировать файлы они не будут создаваться на диске получателя.
Пример копирования всех файлов с расширением.pdf при этом гарантированно не будут созданы "пустые" папки.
rsync -avm --del --include="*.pdf" -f "hide,! */" src/ dest
--progress Выводить информацию о процесс копирования. При передаче обычного файла выводится примерно такая информация:
782448 63% 110.64kB/s 0:00:04
Передано 782448 байт или 63% файла со скоростью 110.64kB/s, до завершения осталось 4 секунды, если скорость передачи не изменится.
Данная статистика может быть недостоверной при использовании частичной (incremental) передачи данных.
-P Аналогично указанию одновременно двух опций --partial --progress.
--password-file Позволяет указать файл с паролем для доступа к удаленному демону rsync. Файл должен содержать только пароль в виде одной строки. Полезна, только в случае использования встроенного программу протокола доступа.
--list-only Показать список файлов, которые должны быть переданы, но не передавать их.
--bwlimit=KBPS Ограничить максимальную скорость. KBPS задается в килобайтах в секунду.
--write-batch=FILE Записывать файл, который впоследствии может быть применён в параметре --read-batch . Подробнее описано ниже в пакетном режиме ("BATCH MODE")
--only-write-batch=FILE Работает аналогично --write-batch , однако не делает изменений в системе-получателе.
--read-batch=FILE Выполнить действия, записанные в файле FILE в пакетном режиме. Файл может быть сгенерирован с помощью --write-batch или создан вручную.
--protocol=NUM Использовать старые версии протокола обмена. Целесообразно при создании пакетного файла, предназначенного для использования ранними версиями rsync.
-4 или -6 --ipv4 или --ipv6 Сообщает программе, какой из протоколов является предпочтительным. Влияет только на сокеты, над которыми имеется прямой контроль. Например, исходящие сокеты при непосредственно контакте с rsync демоном.
--checksum-seed=NUM
-E --extended-attributes Копировать специальные атрибуты файлов в Apple Mac OS X. Требует специальной версии rsync для OS X.
--cache Специальный параметр для версий в Mac OS X. Включает кэширование операций ввода/вывода файловой системы. В противном случае для ограничения потребляемой памяти используется fcntl(F_NOCACHE).

Параметры, используемые при запуске демона rsync

--daemon Говорит rsync, что она запускается как демон. Запуск демона может быть выполнен клиентом, используя host::module или синтаксис rsync://host/module/.
--address Позволяет определить IP адрес или имя хоста при запуске демона, с которым он связан. Это позволяет использовать виртуальный хостинг с параметром --config.
--bwlimit=KBPS Позволяет задать максимальную скорость отправляемых данных демоном. При этом клиент может задать меньшую скорость.
--config=FILE Задает альтернативный файл конфигурации. Используется только если задан параметр --daemon. По умолчанию используется файл /etc/rsyncd.conf, за исключением запуска демона через программу удаленного доступа и удаленный пользователь не является суперпользователем. В этом случае ищется файл rsyncd.conf в папке $HOME
--no-detach Заставляет демона не отсоединяться и остаться фоновым процессом. Полезна для отладки, при запуске службы под Cygwin. Параметр игнорируется, если rsync запущен под управлением inetd или ssh.
--port=PORT Задает альтернативный порт для прослушивания демоном. По умолчанию 873.
--log-file=FILE Задает имя файла журнала, вместо файла указанного в конфигурационном файле.
--log-file-format=FORMAT Позволяет определить формат данных выводимых в журнал протокола. Если строка FORMAT пустая, то отключает ведение журнала.
--sockopts Переопределяет формат сокета заданного в rsyncd.conf и имеет аналогичный синтаксис.
-v, --verbose Увеличивает объем выводимых данных в журнал работы демона во время его работы.
-4, --ipv4 или -6, --ipv6 Определяет формат предпочтительных сокетов IPv4/IPv6, которые rsync демон будет использовать для прослушивания соединений. Если в Linux возникает ошибка "address already in use", а порт при этом не используется никакой другой программой, попробуйте использовать данный параметр.
-h, --help При указании после --daemon, позволяет напечатать краткую подсказку по параметрам, которые можно использовать при запуске демона

Правила фильтрации

Позволяют настраивать какие файлы должны быть включены в копирование (include), а какие исключены. Шаблоны включения/исключения могут быть указаны непосредственно в командной строке, а могут быль прочитаны из фала или канала ввода.

Когда будет построено дерево каталогов для копирования, rsync будет проверять каждое встреченное имя файла на соответствие шаблонам. Сначала проверяется на соответствие шаблона исключения, потом включения.

Шаблоны правил имеют следующий синтаксис:

RULE

RULE,MODIFIERS

Возможно использование коротких или длинных имен правил, которые описаны ниже. Если Вы используете имена, то необходимо использовать запятую для разделения правил (RULE) и модификаторов (MODIFIERS). Шаблон должны следовать после одиночного пробела или символа подчеркивания. Допустимо использование следующих приставок для описания правил:

Exclude, - определяет шаблон исключений.

Include, + определяет шаблон включений.

Merge, . указывает на файл, в котором описаны дополнительные правила.

Dir-merge, : указывает на каталог слияния.

Hide, H определяет шаблон для передачи скрытых файлов.

Show, S файлы, которые не совпадают с шаблоном и не скрытые.

Protect, P задает шаблон для файлов, которые нельзя удалять.

Risk, R файл совпадающие с шаблоном и незащищенные.

Clear, ! очищает текущие значения включений/исключений. Не требует параметров.

Если правила считываются из файла, то строки начинающиеся с символа # и пустые строки игнорируются.

Параметры --include/--exclude не дают тех возможностей для фильтрации файлов как описано выше. Данные параметры, как и --filter могут принимать только одно правило (шаблон для каждого). Для полного использования всех возможностей используйте импорт правил из файла с параметрами --filter (синтаксис для файла) или --include-from/--exclude-from.

Правила шаблонов для включения/исключения файлов.

INCLUDE/EXCLUDE PATTERN RULES

При определении файлов, которые подлежат копированию возможно использование шаблонов, которые задаются в структурах, начинающихся с символов "+" и "-". Данные шаблоны сравниваются с именами файлов выборке.

Если шаблон начинается с символа "/", то это означает привязку файла к конкретному месту в иерархии файлов, в противном случае сравнение происходит с конца пути. Это действие похоже на начальный символ "^" в регулярных выражениях. Таким образом "/foo" будет соответствовать корневой папке передачи или в файле слияния (merge-file).

Обычное указание "foo" будет соответствовать файлу с таким именем, встреченным в любом месте выборки. Подробнее о применении "/" в начале шаблона в разделе ANCHORING INCLUDE/EXCLUDE PATTERNS.

  • Если шаблон заканчивается на слэш "/", это указывает, что он применяется для каталогов, а не для файлов, ссылок и устройств.
  • В шаблоне можно использовать три подстановочных символа: "*", "?" и "[".
    • "*" указывает на любые символы компонента пути и его действие ограничивается символами "/".
    • "**" все символы, включая "/"
    • "?" один любой символ, за исключением "/"
    • "[" вводит класс символов таких как или [[:alpha:]].
  • обратный слэш "\" используется для защиты от подстановочных символов, то есть "\?" будет использовано как символ, а не подстановочный знак.
  • Если шаблон содержит "/" (не считая завершающий) или "**", то они сравниваются с полным путем, включая каталоги, идущие в начале. Если шаблон не содержит указанные символы, то сравнение идет только по последнему компоненту полного имени файла.

Последовательность символов "dir_name/***" будет совпадать и с каталогом (если было бы указано "dir_name/") и с файлами в данной папке, как если было указано "dir_name/**" (начиная с версии 2.6.7)

Однако когда вы используете параметр --recursive (-r) (он встроен в -a), то каждый подкаталог посещается сверху вниз, то шаблоны include/exclude для файлов и каталогов применяются с рекурсивно. Например, include "/foo/bar/baz" не должны исключать содержимое "/foo" и "/foo/bar"). Если вы исключите отдельный каталог, то rsync может исключить из обхода его подкаталоги, поэтому важно правильно использовать "*"

Следующая группа шаблонов неправильная:

+ /some/path/this-file-will-not-be-found

+ /file-is-included

Это ошибка, так как родительский каталог "same" исключен из выборки и rsync никогда не найдет файлы, находящиеся в папках "some" или "some/path". Одним из решений проблемы будет прямое указание включения всех каталогов в иерархии, как это сделано в следующем примере:

+ /some/path/this-file-is-found

+ /file-also-included

Вот некоторые примеры фильтров включения/исключения:

  • "- *.o" будут исключены все файлы, совпадающие с *.o
  • "- /foo" исключить копирования файлы или папки с именем foo в корневой папке копирования
  • "- foo/" исключить из копирования каталог foo, встреченный в любом месте дерева
  • "- /foo/*/bar" будут исключены файлы bar из копирования, встреченные в каталогах на два уровня ниже начального.
  • "+ */", "+ *.c", and "- *" - данное сочетание позволит скопировать дерево каталогов и все файлы расширением.c. Больше ничего скопировано не будет.
  • Комбинация "+ foo/", "+ foo/bar.c", and "- *" скопирует только сами каталоги foo и файлы foo/bar.c.

Правила фильтров для MERGE-FILE

Существует возможность объединения файлов с фильтрами в условиях правил фильтрации, указав объединение (.) или объединение каталогов (:)

Существует два типа объединения файлов - одиночный (.) или на каталог (:). В случае одиночного типа файл считывается один раз, и эти правила включаются в список фильтров. В режиме (:) rsync сканирует все каталоги и отслеживает merge файлы. И если такой файл существует, то включает их содержимое в список унаследованных правил. Эти правила должны быть созданы на отправляющей стороне, потому что именно она сканирует каталоги для выявления файлов предназначенных для копирования. Эти файлы в случае необходимости могут быть переданы принимающей стороне^ если вы хотите, чтобы файлы не удалялись. (смотреть раздел PER-DIRECTORY RULES AND DELETE).

Некоторые примеры:

merge /etc/rsync/default.rules . /etc/rsync/default.rules dir-merge .per-dir-filter dir-merge,n- .non-inherited-per-dir-excludes:n- .non-inherited-per-dir-excludes

Следующие модификаторы могут быть применены:

  • - файл с фильтрами состоит исключительно из шаблонов исключения (возможно использование комментариев)
  • + Файл состоит только из шаблонов включения и комментариев.
  • C файл должен быть прочитан CVS совместимым способом. Если имя не указано, то предполагается ".cvsignore".
  • e исключить имя merge-файла из передачи. Например "dir-merge,e .rules" аналогично "dir-merge .rules" и "- .rules".
  • n указывает, что правила не распространяются на подкаталоги.
  • w предполагает разделение слов с помощью пробелов (whitespace) вместо нормального построчного считывания. В этом случае строка "- foo + bar" будет считаться двумя шаблонами.

После "+" и "-" могут быть использованы следующие модификаторы:

  • "/" шаблон должен сравниваться с абсолютным путем к объекту. Например, "-/ /etc/passwd" исключить передаче файла passwd из каталога "/etc", а "-/ subdir/foo" должна исключать "foo" в том случае если она находится в любом каталоге с именем "subdir" даже если "foo" находится в начальном каталоге, предназначенном для копирования.
  • "!" Логическое "нет". Например, последовательность "-! */" должна исключать из копирования все, что не является каталогом.
  • C указывает, что все глобальные правила CVS-исключений должны быть вставлены в месте "-C".
  • s - правило используется отправляющей стороной. По умолчанию считается, что шаблон влияет на обе стороны в копировании, если не указано --delete-excluded.
  • r - указывает, что данные правила должны быть использованы на отправляющей стороне.

В режиме объединения каталогов (:) правила фильтрации файла действуют и для всех подкаталогов относительно каталога, где он был найден, если только не был указан модификатор "n". В случаях если в подкаталогах, на которые были унаследованы правила тоже есть merge-files, то правила из новых файлов будут иметь более высокий приоритет. Чтобы предотвратить действие одного конкретного правила можно использовать указание абсолютного пути с лидирующим "/".

Вот пример фильтра, который должен быть указан с помощью параметра --filter: --filter=". file"

Merge /home/user/.global-filter - *.gz dir-merge .rules + *. - *.o

Это позволит объединить содержимое файла.global-filter в начале списка и также включает содержимое файлов.rules в фильтры.

Если в режиме по каталогам в merge-file указан вместе с путем начала дерева копирования, rsync будет сканировать все родительские папки начиная с начального каталога копирования.

Filter=": /.rsync-filter"

Данное правило заставляет программу отсканировать все каталоги, начиная со стартового на наличие файлов.rsync-filter.

Некоторые примеры команд предварительного сканирования для merge-files:

Rsync -avF /src/path/ /dest/dir rsync -av --filter=": ../../.rsync-filter" /src/path/ /dest/dir rsync -av --filter=": .rsync-filter" /src/path/ /dest/dir

Первые две команды будут искать файлы с правилами ".rsync-filter" в "/" и "/src" до того как будет начато нормальное сканирование в каталоге "/src/path" и его подкаталогах. Третья команда избегает поиска файла с правилами фильтрации в родительском каталоге и ищет его во всех каталогах, которые передаются.

Если вы хотите включить содержимое ".cvsignore" в ваш шаблон, вы должны использовать модификатор ":C", который включит в шаблоны (:), но будет разбирать его по CVS-совместимым правилам.

Правила очистки списка фильтров.

LIST-CLEARING FILTER RULE

Действующий список фильтров можно очищать, используя правило "!". С помощью него возможна очистка как глобальных (изначальных) фильтров, так и унаследованных.

Закрепленные INCLUDE/EXCLUDE шаблоны

Как уже говорилось раньше глобальные шаблоны, возможно закреплять на начальный каталог (они называются закрепленными "ANCHORING"). Эти правила касаются шаблонов, начинающихся с "/".

Предположим, что мы хотим сравнить два исходных файла, один как абсолютный путь "/home/me/foo/bar", а второй просто с путем "/home/you/bar/baz". Ниже как различные команды сравнивают файлы для передачи

Пример команды: rsync -a /home/me /home/you /dest +/- pattern: /me/foo/bar +/- pattern: /you/bar/baz Файл назначения: /dest/me/foo/bar Файл назначения: /dest/you/bar/baz Пример команды: rsync -a /home/me/ /home/you/ /dest +/- pattern: /foo/bar (note missing "me") +/- pattern: /bar/baz (note missing "you") Файл назначения: /dest/foo/bar Файл назначения: /dest/bar/baz Пример команды: rsync -a --relative /home/me/ /home/you /dest +/- pattern: /home/me/foo/bar (note full path) +/- pattern: /home/you/bar/baz (ditto) Файл назначения: /dest/home/me/foo/bar Файл назначения: /dest/home/you/bar/baz

Пример команды:

Cd /home; rsync -a --relative me/foo you/ /dest +/- pattern: /me/foo/bar (начать с указанного пути) +/- pattern: /you/bar/baz (ditto) Файл назначения: /dest/me/foo/bar Файл назначения: /dest/you/bar/baz

Самый простой способ узнать, что будет скопировано, это использовать параметр --dry-run --verbose и задать / в начале имени.

Режимы фильтрации по каталогам и удаления файлов.

PER-DIRECTORY RULES AND DELETE

Без параметра delete правила (:) действуют только на отправляющей стороне, так что можно спокойно исключить передачу файлов с правилами. Следующие две команды эквивалентны:

Rsync -av --filter=": .excl" --exclude=.excl host:src/dir /dest rsync -av --filter=":e .excl" host:src/dir /dest

Если вы хотите удалять на принимающей стороне и хотите исключить некоторые файлы из удаления, необходимо удостовериться, что принимающая сторона знает об этих исключениях. Самый простой способ использовать режим (:) и параметр --delete-after, это гарантирует, что принимающая сторона сначала получит все правила исключений и только потом попытается удалить что-либо.

Rsync -avF --delete-after host:src/dir /dest

Однако если файлы с шаблонами (merge-files) сами не передаются, то необходимо указать глобальные правила исключения, указав их в командной строке или поддерживать свои файлы фильтрации на принимающем компьютере. Пример:

Rsync -av --filter=": .rules" --filter=". /my/extra.rules" --delete host:src/dir /dest

В данном примере extra.rules может влиять на обе стороны, но на отправляющей стороне правила подчиняются содержимому файлов.rules так как они описаны после ":".

Пакетный режим

Пакетный режим может быть использован для выполнения одних и тех же обновлений для большого количества однотипных систем. Предположим, что имеется дерево документов, которое было реплицировано на некоторое количество компьютеров. Теперь предположим, что в некоторые документы были внесены изменения и эти изменения необходимо перенести на все компьютеры. Для этого rsync запускается с параметром записи пакетного режима на один из существующих узлов. Записанный таким образом список действий можно использовать для переноса файлов на все остальные узлы.

Чтобы применить записанные действия для остальных компьютеров необходимо запустить программу в пакетном режиме указав конечное дерево и имя пакетного файла для чтения.

Для удобства во время записи дополнительно создается скрипт с расширением ".sh" и заданным именем. Данный файл содержит команду, подходящую для обновления дерева файлов на удаленном компьютере. Он может, выполнен в bash с параметром, указывающим на каталог компьютера назначения.

Примеры:

$ rsync --write-batch=foo -a host:/source/dir/ /adest/dir/ $ scp foo* remote: $ ssh remote ./foo.sh /bdest/dir/ $ rsync --write-batch=foo -a /source/dir/ /adest/dir/ $ ssh remote rsync --read-batch=- -a /bdest/dir/

В данных примерах программа используется для обновления /adest/dir/ из /source/dir/ и информация для повторения будет записана в файлах "foo" и "foo.sh". Различия между двумя примерами показывают возможную гибкость применения.

Первый пример показывает, что первоначальная копия не должна быть локальной. Вы можете брать или класть данные на удаленный компьютер с помощью удаленного доступа или rsync-демона. И потом он использует созданный файл foo.sh на удаленном компьютере.

Второй пример считывает пакетные данные из стандартного ввода, так как пакетный файл не нуждается в предварительном копировании на удаленный компьютер. Этот пример позволяет избежать использования скрипта foo.sh.

Предостережения:

При использовании пакетного режима (чтение) ожидается, что каталог назначения будет полностью идентичен дереву, с которого делался пакетный файл. В случае обнаружения расхождений обновление может быть прервано с сообщением об ошибке или с предупреждением. Если вы хотите, чтобы обновление было выполнено независимо от расхождения размера файлов и их дат, то обновление необходимо выполнять с параметром -l (при чтении пакетного файла). В случае возникновения ошибки существует возможность, что дерево будет обновлено лишь частично. В этих случаях уместно использование rsync в обычном (не пакетном) режиме, чтобы восстановить дерево файлов.

Версия rsync, используемая для обновления должна быть той же версии (или свежее), чем использованная при создании пакетного файла. (Серьезные изменения пакетных файлов были произведены в в версии 2.6.3)

При чтении пакетного файла будут принудительно установлены некоторые параметры для сравнения данных. Другие параметры могут быть изменены. Например --write-batch изменяется на --read-batch, --files-from отбрасывается. --filter/--include/--exclude не требуются, кроме использования --delete.

Символические ссылки.

Существует три варианта поведения программы, когда она встречает символическую ссылку в каталоге.

Если использован --copy-links, то будет скопирован файл, на который указывает ссылка, а не сама ссылка.

Ssh remotehost /bin/true > out.dat

И последующее изучение файла out.dat. Если все работает нормально, то размер этого файла, должен быть равен 0. Если же вы имеете описанную ошибку от rsync, то вероятно обнаружите в этом файле текст или данные. Их необходимо изучить и разобраться в чем проблема. Очень частой ошибкой является неправильно сконфигурированный скрипт запуска (такие файлы как.cshrc или.profile) в которых есть команды для неинтерактивного входа.

Если у вас возникают проблемы с настройкой шаблонов фильтрации, следует указать параметр -vv. На этом уровне отчетности программа покажет, почему был включен или исключен конкретный файл.

Статусы завершения Rsync.

0 Успешное завершение (Success)

1 Синтаксическая ошибка или ошибка выполнения (Syntax or usage error)

2 Несовместимые протоколы (Protocol incompatibility)

Используемые файлы /etc/rsyncd.conf или rsyncd.conf

рекрут 24 октября 2011 в 00:52

Rsync: мощная утилита для быстрого, гибкого удаленного и локального копирования файлов

  • Чулан *

Rsync разработан для замены rcp – древней программы для удаленного копирования под Unix. Благодаря широким возможностям синхронизации и передачи файлов, rsync часто применяется для создания зеркал.
Использование хитроумного алгоритма, позволяет rsync передавать только изменения в файлах, причем для выявления изменений ему не надо сравнивать два файла. Кроме того, rsync производит сжатие на лету, позволяя тем самым передавать файлы с максимальной эффективностью.
Кроме вышеописанных вкусностей, rsync обладает также и несколькими полезными возможностями обеспечения безопасности. Он поддерживает ssh – рекомендованный протокол для безопасной передачи данных; перед обработкой информации производит ее запись во временный файл, чтобы ничего не случилось с оригиналом, наконец, он поддерживает специальный режим безопасной отладки команд.
Rsync прост в использовании, но не является программой «click-and-play». Это -мощный инструмент, который может быть очень полезным, но не стоит забывать об осторожности, так как его с помощью легко что-нибудь испортить.

Синтаксис утилиты
Синтаксис утилиты простой и довольно обыденный.
rsync [опции] источник [приемник]
Указав только источник, мы увидим список файлов без операции копирования.

Опции и примеры
Для простоты понимания, операции синхронизации привожу сперва локально.
Быстрый способ синхронизировать два каталога, это использовать опцию -a :
rsync -a foobar_src/ foobar_dst/
В данном случае файлы и директории из источника скопируются в приемник, при этом, если там были файлы, то совпавшие по имени будут перезаписаны, а остальные не тронуты.

Опция -a задает архивный режим работы утилиты, и является эквивалентом набора опций:
-r, --recursive - рекурсивный режим;
-l, --links - пересоздание symlinks , это значит, что символические ссылки будут так же переноситься;
-p, --perms - перенос прав;
-t, --times - передача времени модификации и его обновление на удаленной системе. Этот ключ должен быть установлен для точной синхронизации;
-g, --group - установить группу конечного файла таким же, как и у исходного;
-o, --owner - установить владельца конечного файла таким же, как и у исходного;
-D, - same as --devices --specials - установить тип файла устройства и файла специального типа таким же, как у исходного.
В итоге получаем копию директории источника. Кстати, это можно использовать при переносе ОС на другой винчестер, подправив /etc/fstab, установив/переустановив grub на новом винте - получаем рабочую систему, но это уже другая тема.

Для вывода информации о работе утилиты, существует опция -v, --verbose . Чем больше опций -v , тем боле информативным будет вывод утилиты. Максимальная информативность достигается при четырех опциях -v, --verbose .

Если у нас содержится в директории источника актуальная информация, то чтобы не засорять приемник информацией, которая в процессе работы была удалена или перемещена в источнике, нужно старые файлы и директории удалить. Для этого есть несколько опций удаления, каждая из которых предоставляет свой алгоритм удаления. Их аж шесть!
--del - сокращенная форма --delete-during ;
--delete - просто удалить посторонние файлы из приемника;
--delete-before - приемник удаляет перед передачей;
--delete-during - приемник удаляет в процессе передачи, но не перед;
--delete-delay - отложенное удаление/найти файлы для удаления в процессе передачи, но удалить после передачи;
--delete-after - приемник удаляет после передачи, но не перед ней;
--delete-excluded - так же удалить исключенные файлы в приемнике, для этого задается шаблон (--exclude=PATTERN).

Допустим у нас на приемнике есть более свежие файлы, и мы не хотим что бы они были перезаписаны старыми из источника, то для этого применяется ключ -u, --update .
-u, --update - пропустить файлы, если на приемнике файл новее.
Не стоит пугаться если изменились даты директорий, т.к. сами файлы небыли перезаписаны.

Порой файлы могут повредится или быть модифицырованы, но совпадать и датой и размером. То можно использовать проверку контрольной суммы, опция -c, --checksum .

Моей задачей было разобраться, как сделать резервную копию коллекций фотографий, музыки, наработок по университету и работе. При этом в источнике информация всегда актуальная, а то что удалено - мусор. Пример для решения моей задачи:
rsync -auvv --delete-during foobar_src/ foobar_dst/
Это обновит мой приемник, если он был уже чем то заполнен - вычистит то, чего нет в источнике, но не затронет файлы которые поновее, выведет статистику и состояние по каждому файлу.

Удаленная работа
Кроме того, очень полезным будет его способность работать через ssh. Что обеспечивает шифрование канала, что очень важно, если вы синхронизируете два сервера в сети интернет. Для уменьшение трафика, rsync так-же умеет сжимать данные, при передаче по сети.
Необходимы следующие опции:
-e - задать удаленный шелл для использования;
-z - сжимать передаваемые данные, либо задать:
-compress-level=9 - сжатие с установкой уровня компрессии.

Пример копирования с удаленного хоста по протоколу ssh:
rsync -avv --delete-during -compress-level=9 -e "ssh -p remote_ssh_port" user@host:/dir/to/foobar_src foobar_dst/
При этом, на стороне источника нужно иметь установленную утилиту rsync.

Надеюсь эта информация будет полезна многим. Больше информации про утилиту rsync вы сможете найти в ее же документации, благо она хорошо описана.
Там же вы можете найти информацию о том, как поднять дэмон rSync для непосредственного подключения без использования удаленного ssh шелла, а так же описание множества других опций на любой вкус и цвет.

Теги: rsync, копирование, резервирование файлов, синхронизация файлов