Папір – у цифру. Українські архіви – світові лідери за темпами оцифрування документів

У 2023 році українські архіви зробили понад 21 мільйон цифрових копій (сторінок або кадрів). Німеччина повідомила про близько 21 млн зроблених цифрових копій. «Понад» - це більше, аніж «близько»

Відколи виникли архіви, то почались спроби копіювати архівні документи. Це робилося з багатьох міркувань – максимально уберегти оригінали документів від пошкоджень, прочитати згасаючий текст, офіційно підтвердити якусь інформацію.

Спочатку архівні документи копіювали простим переписуванням, з розвитком технологій стало можливим фотографування документів на плівку, ще пізніше – ксерокопіювання. Аж врешті появилось оцифрування, тобто створення цифрової копії паперового або аудіовізуального документа. Перше цифрове фото з'явилось у 1957 році.

 
Річард Томас працює на першому у світі цифровому сканері, 1957 рік

Оцифрування архівів у світі розпочалось на початку – у середині 1990-х рр. Тобто, можемо говорити про історичний процес тривалістю уже 30 років.

Архіви у світі оцифровуються лавиноподібно. Щороку кількість оцифрованих аналогових архівних документів у світі збільшується. З'являється усе більше онлайн-архівів з усе більшими архівними колекціями.

Україна почала відносно масштабне оцифрування у 2005 році, однак темпи були надзвичайно повільними. Суттєві зрушення відбулись у 2020 році, коли Державна архівна служба України розпочала активну роботу над оцифруванням документів.

У 2022 році ухвалено "Програму оцифрування архівних інформаційних ресурсів на 2022-2025 роки". А уже у 2023 році архіви зробили понад 21 млн копій архівних документів.

Цифра вражала.

 
Сайт Державного комітету архівів (нині – Державна архівна служба) був створений у 2000 році. У 2020 році сайт оновлено до сучасного дизайну

У світі є 193 держави. Ми звернулись до 159 національних архівних служб із запитанням про кількість оцифрованих у них впродовж 2023 року архівних документів. Ми не надсилали листи до держави-агресора – Росії, а також Білорусі.

Інші держави, до архівних служб яких ми не писали, або не мають архівів (це дрібні острівні держави, які можуть мати один об'єднаний архів на кілька держав або послуговуватись архівними службами "великих" держав, здебільшого, колишніх метрополій) або з ними відсутні шляхи комунікації.

Також ми звернулись до Міністерства закордонних справ, аби вони зробили відповідні запити через дипломатичні канали – це надало нам вагому допомогу у збиранні інформації.

Де нам не відповіли офіційно, ми спробували дізнатись статистику через сторінки архівних служб у соцмережах. Серед європейських держав також поширена практика оформлення запитів онлайн через особисті кабінети із використанням національних цифрових підписів. Це дещо ускладнювало отримання нами необхідних відомостей.

Також промоніторили офіційні сайти архівних служб держав світу, знайшли та перечитали офіційні звіти та повідомлення про кількість оцифрованих документів. Це допомогло перевірити деякі дані.

Врешті, ми зібрали 61 відповідь. Чотири держави відповіли, що не володіють інформацією про кількість оцифрованих документів, не ведуть такої статистики або надали нерелевантні дані. Ще сім повідомили про нульовий показник. Усі основні гравці світового архівного поля у нашій статистиці присутні.

Отримані відповіді були зведені у таблицю. Тут ми подаємо держави, які зробили у 2023 році більше 10 млн копій:

 

Як бачите, першою у цьому списку є Фінляндія з 34 млн. Утім, з листа Національного архіву Фінляндії стає зрозумілим, що це - кількість сканованих традиційних документів разом із прийнятими на зберігання born-digital документів, адже з 2022 року у Фінляндії на зберігання більше не приймають паперові документи.

У 2023 році українські архіви зробили понад 21 мільйон цифрових копій (сторінок або кадрів). Німеччина повідомила про близько 21 млн зроблених цифрових копій. "Понад" - це більше, аніж "близько".

Далі за кількістю оцифрованих документів йдуть Ізраїль та Норвегія – близько 18 млн. Індія – не більше 15 млн. Певним здивуванням для нас був показник Узбекистану – 14,7 млн копій.

Україна зробила втричі більше копій, аніж США, у 3,5 рази більше копій, аніж Польща, майже у 4 рази більше, аніж Канада. І це в умовах війни та з мінімальним залученням бюджетних грошей.

Таким чином, можемо впевнено стверджувати, що Україна є світовим лідером за темпами оцифрованих архівних документів.

 

Ми рахували кількість цифрових копій, тобто зроблених кадрів. Не документів, не справ чи фондів. Йдеться, зазвичай, про розвороти сторінок, по дві сторінки на 1 кадр. Якщо ж справи розшиті, то один кадр робиться з однієї сторінки, у тому числі пустої та незаповненої.

Держави мають різні підходи до статистики оцифрування архівних документів. Є підрахунки у кілометрах архівних полиць, документи з яких оцифровані; у відсотках до загальної кількості документів, що зберігаються в архівах; в одиницях виміру інформації – гіга-, тера- та петабайтах. Тому ми спеціально наголошували у листуванні на кількості зроблених кадрів.

Також існують розбіжності у розумінні оцифрування аудіовізуальних документів. Наприклад, один відеозапис у різних державах може враховуватись як один файл, як певна кількість хвилин чи секунд, як кількість кадрів і як кількість одиниць інформації. Подібна ситуація із плівками фотонегативів. У своїй роботі у таких випадках ми враховували підходи держав.

Не в усіх державах, на відміну від України, архівні справи оцифровуються із врахуванням контексту – обкладинки, аркуша використання, описів тощо. Оцифрування цих елементів додає контекст і сприяє кращому розумінню документа.

Не завжди оцифровані архівні документи – це документи, які викладені в онлайн-доступ.

Одна справа – оцифрувати документ і цю копію фізично зберегти в архіві або на віддаленому сервері і надавати доступ до неї у читальному залі. І зовсім інша – виставити документи у вільному доступі в Інтернеті. Це є різні процеси, до яких мають бути залучені архівісти з іншими знаннями та уміннями, необхідна інша техніка.

Різниця у кількості оцифрованих документів та копій, оприлюднених в Інтернеті є, наприклад у Франції, Іспанії, Індії та інших державах. Стан, коли документ оцифрований, але відсутній на Міжархівному пошуковому порталі чи на сайті архіву – нормальний. Адже до такого документа є доступ у читальному залі.

Подекуди архіви, окрім суто статистичної інформації, повідомляли про підходи до оцифрування.

 

Найпоширенішими підходами є:

  1. офіційне партнерство, у тому числі комерційне, коли інституції оцифровують цікаві їм масиви документів. Наприклад, FamilySearch сканує генеалогічні джерела, або єврейські фонди та організації оцифровують документи, пов'язані із Голокостом. При цьому, фінансування таких робіт, техніка та залучення фахівців є предметом угод та домовленостей;
  2. краудсорсинг, коли скануванням займаються користувачі архівів, а зроблені копії належної якості передаються архівам;
  3. внутрішні проєкти архівів, коли сканування відбувається силами архівістів та на архівному обладнанні; при цьому вибір документів для оцифрування залежить від архіву; також архіви часто наймають сторонні організації для сканування документів.

Ще донедавна користувачі українських архівів заздрісно дивились на польський портал Szukajwarchiwach. Тепер можемо цілком пишатися своїм Міжархівним пошуковим порталом, сторінками з оцифрованими документами на сайтах державних архівів, комп'ютерами у читальних залах в архівах, де можна переглянути увесь масив оцифрованих архівних документів.

Темпи не збавляємо! Оцифруємо все!

Теми

Ярослав Кравченко : Тимко Бойчук. "Йому завжди буде двадцять шість…"

Молодший брат Михайла Бойчука – Тимофій – прожив коротке, але яскраве мистецьке життя. Тимкові навчання і творчість випали на швидкоплинні роки існування Української Академії Мистецтва в рамах Української державності. Й помер він у рік, коли червонозірчасті "соціальні експериментатори перетворили її на інститут пластичних мистецтв". Йому завжди буде двадцять шість...

Анатолій Хромов, Віталій Скальський: Папір – у цифру. Українські архіви – світові лідери за темпами оцифрування документів

У 2023 році українські архіви зробили понад 21 мільйон цифрових копій (сторінок або кадрів). Німеччина повідомила про близько 21 млн зроблених цифрових копій. «Понад» - це більше, аніж «близько»

Володимир Старик: Назар та Луція Данилюки. Якою була українська еліта Буковини до її знищення московськими окупантами

Іконою українського визвольного руху на Буковині останніми роками вважається подружжя Назарія і Луції Данилюків, ці персонажі Шекспірівського масштабу, життя та смерть яких дасться описати трьома поняттями – любов, вірність і зрада.

Олександр Зінченко: Що не так із колонкою Чапутовича?

На шпальтах консервативної газети "Rzeczpospolita" вийшла колонка колишнього міністра закордонних справ Польщі Яцека Чапутовіча під назвою "Політика гієни почувається добре". Він зтаврував політику чинної влади, як політику гієн - тих, хто намагається скористатися вразливим становищем України, щоб вирішити свої питання. Опозиційний політик звинувачує правлячу у Польщі коаліцію у шантажі України історичними питаннями.