آموزشچگونه

آموزش خط فرمان: قسمت چهل و هفتم، آرشیو کردن و بکاپ گرفتن

Print Friendly, PDF & Email

یکی از وظایف اولیه هر مدیر سیستمی، نگهداری ایمن داده‌ها است. یکی از روش‌های انجام این کار، بکاپ‌گیری منظم فایل‌های سیستم بر اساس جدول زمانی است.

حتی اگر که شما یک مدیر سیستم نیستید، گاها مفید است که از داده‌هایی که در سیستم خود دارید، کپی بگیرید و حتی مجموع عظیمی از داده‌های خود را از یک دیوایس به دیوایس دیگر جابه‌جا کنید. در این درس و درس‌های پیشِ رو نگاهی به رایج‌ترین برنامه‌های موجود برای مدیریت مجموعه‌ای از فایل‌ها خواهیم انداخت.

بدین منظور از فرمان‌های gzip، bzip2، tar، zip و rsync استفاده خواهیم کرد.

فشرده‌سازی

در تاریخچه کامپیوتر، همیشه تلاش می‌شده داده‌ها را تا کمترین اندازه ممکن کوچک کرد تا فضای کمتری را اشغال کند. این فضا می‌تواند حافظه Memory یا دیوایس‌های ذخیره‌سازی یا پهنای باند شبکه باشد، تفاوتی نمی‌کند. بسیاری از سرویس‌های داده که امروزه از آن‌ها استفاده می‌کنیم، مانند موزیک‌پلیرهای قابل حمل، تلویزیون‌های با کیفیت بالا، یا پهنای باند اینترنت، وجود خود را مدیون تکنیک‌های فشرده‌سازی تاثیرگذار هستند.

فشرده‌سازی داده، پروسه حذف افزونگی و حشو (redundancy) داده است. بگذارید یک مثال غیرواقعی را در نظر بگیریم. فرض کنید ما یک فایل تصویر کاملا سیاه داریم که ۱۰۰ پیکسل طول و ۱۰۰ پیکسل ارتفاع دارد. به‌عبارتی ذخیره‌سازی داده (۲۴ بیت یا همان ۳ بایت بر پیکسل)، تصویر ۳۰۰۰۰ بایت از فضا را اشغال می‌کند:

۳*۱۰۰*۱۰۰=۳۰۰۰۰

یک فایل تصویر که فقط دارای یک رنگ است، حاوی داده‌های حشو و افزونگی بالایی است. اگر ما باهوش بودیم، بایستی داده را به نحوی Encode می‌کردیم که به سادگی این واقعیت را توصیف می‌کرد که ما یک بلوک ۳۰۰۰۰ پیکسلی رنگ سیاه داریم. پس به‌جای استفاده از یک بلوک داده حاوی ۳۰۰۰۰ صفر (سیاه معمولا در فایل‌های تصویر با عدد صفر تعیین می‌گردد)، می‌توانستیم داده را با شماره ۳۰۰۰۰ تعیین کنیم و به‌دنبال آن یک صفر که نشان‌دهنده رنگ سیاه ماست. این نوع طرح فشرده‌سازی داده run-length encoding به معنی کدگذاری با طول، نامیده می‌شود. که یکی از تکنیک‌های فشرده‌سازی بنیادین است. تکنیک‌های امروزه بسیار پیچیده‌تر و پیشرفته‌تر هستند ولی هدف اصلی همان قبلی اس. یعنی از شر افزونگی و حشو (همان داده‌های تکراری) خلاص شویم.

الگوریتم‌های فشرده‌سازی (تکنیک‌های ریاضی که به‌منظور فشرده‌سازی استفاده می‌شوند) به دو دسته‌بندی اصلیlossless  (به معنای بدون اتلاف) و lossy (به معنای با اتلاف) تقسیم می‌گردند.

فشرده‌سازی lossless از تمام داده‌هایی که در شکل اورجینال فایل وجود دارد، محافظت می‌کند و هیچ داده‌ای از دست نمی‌رود. بدین معنی که فایل بازیابی شده دقیقا همان فایل اصلی قبل از فشرده‌سازی است.

در مقابل، فشرده‌سازی lossy را داریم کهدر حین فشرده‌سازی، داده‌ها را حذف می‌کند تا فشرده‌سازی بیشتری صورت پذیرد و حجم داده کاهش یابد.

زمانی که یک فایل lossy بازیابی می‌شود، با نسخه اصلی آن برابری نمی‌کند! مثال‌هایی از فشرده‌سازی lossy تصاویر JPEG و فایل‌های MP3 هستند.

در این مبحث ما به اختصار، درباره فشرده‌سازی‌های lossless گفتگو خواهیم کرد. به این دلیل که اکثر داده‌هایی که بر روی کامپیوترها وجود دارند، تحمل از دست دادن داده را نخواهند داشت.

فرمان gzip (فشرده‌سازی یا بسط فایل‌ها)

برنامه gzip به‌منظور فشرده‌سازی یک یا چند فایل، مورد استفاده قرار می‌گیرد. زمانی که gzip اجرا می‌شود، فایل اصلی با یک نسخه فشرده از فایل جایگزین می‌شود. برنامه مربوطه gunzip به‌منظور بازیابی فایل‌های فشرده به شکل اورجینال خود مورد استفاده قرار می‌گیرند.

به مثال زیر توجه کنید:

در این مثال، فایل متنی را با نام foo.txt ایجاد و سپس gzip را اجرا کردیم که فایل اصلی را با نسخه فشرده‌ای با نام foo.txt.gz جایگزین می‌کند. با لیست کردن دایرکتوری‌ها، مشاهده می‌کنیم که نسخه اصلی فایل با نسخه فشرده شده جایگزین می‌شود. به حجم فایل قبل و بعد از فشرده‌سازی، توجه نمایید: مشاهده می‌شود که حجم فایل فشرده شده، هفت برابر کاهش یافته است. سپس با استفاده از فرمان gzip فایل را مجددا از حالت فشرده خارج می‌کنیم. دوباره فایل اصلی، جایگزین نسخه فشرده می‌شود.

فرمان gzip دارای گزینه‌های زیادی است که در لیست زیر مشاهده می‌شود:

مجددا نگاهی به مثال قبلی خواهیم انداخت:

در اینجا فایل foo.txt را با یک نسخه فشرده foo.txt.gz جایگزین کردیم. سپس یکپارچگی فایل فشرده را با استفاده از گزینه‌‌های –t و –v سنجیدیم. در نهایت فایل را به شکل اصلی آن، بازگرداندیم.

علاوه بر این، می‌توان gzip را در شیوه‌های جذابی از طریق خروجی و ورودی استاندارد، مورد استفاده قرار داد:

این فرمان، نسخه فشرده‌ای از لیست دایرکتوری‌ها را در قالب فایل foo.txt.gz ایجاد می‌کند. فرمانgunzip  که فایل‌های gzip را از حالت فشرده خارج می‌کند، فرض می‌کند که اسامی فایل‌ها با پسوند .gz پایان می‌یابند، پس ضرورتی ندارد که پسوند را هنگام استفاده از gunzip اضافه کنیم:

اگر هدف ما فقط نمایش محتوای فایل متنی فشرده باشد، می‌توانیم این کار را از طریق پایپ کردن آن در فرمان less انجام دهیم.

به شیوه‌ای دیگر، برنامه‌ای با نام zcat عرضه شده که همان کار gunzip را به همراه گزینه –c انجام می‌دهد:

فرمانbzip2  (فشرده‌سازی بیشتر به قیمت کاهش سرعت)

فرمانbzip2  (که توسط Julian Seward ایجاد شده) مشابه gzip می‌باشد، ولی الگوریتم متفاوت فشرده‌سازی استفاده می‌نماید که سطوح بالاتری را از فشرده‌سازی (ولی به قیمت کاهش سرعت فشرده‌سازی فایل) کسب می‌کند. اما در اکثر زمینه‌ها، به‌همان شکل gzip عمل می‌نماید. فایلی که با bizp2 فشرده شده باشد، پسوند bz2 دریافت می‌کند:

همان‌طور که می‌بینیم bzip2 را می‌توان به همان شیوه gzip به‌کار برد. همه گزینه‌های gzip به غیر از -r در bzip2 هم پشتیبانی می‌شوند.

توجه داشته باشید که گزینه سطح فشرده‌سازی (-number) معنای متفاوتی در bzip2 دارد. bzip2 به‌منظور فشرده کردن فایل‌ها از bunzip2 و bzcat استفاده می‌کند. همچنین bzip2 دارای برنامه bzip2recover بوده که تلاشی برای بازیابی فایل‌های آسیب‌دیده bz2 را دارد.

منبع: کتاب The Linux Command Line نوشته William E. Shotts

Related Articles

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Close