Учените използват по-малко от 1% от данните, събрани от големия адронов колайдер - Алтернативен изглед
Учените използват по-малко от 1% от данните, събрани от големия адронов колайдер - Алтернативен изглед
Видео: Учените използват по-малко от 1% от данните, събрани от големия адронов колайдер - Алтернативен изглед
Видео: В подмосковную Дубну доставлен магнит, который станет сердцем нового российского коллайдера. 2023, Февруари
Anonim

Ясно е кога има проблем с получаването на научни данни. Но се оказва, че има проблем да ги запазите и обработите.

Цялата серия от високопрофилни открития, направени с помощта на коллайдера, се основаваха на анализа на данните, чийто обем е по-малък от един процент от общия обем на генерираните данни.

Останалите данни се губят безвъзвратно.

26,7-километровият тунел за сблъсък се използва за ускоряване на частици, близки до скоростта на светлината. Два потока от частици, движещи се в противоположни посоки, се сблъскват в точки в пространството, наблюдавани от чувствителни сензори. Дори при най-ниското ниво на плътност на протонните лъчи, съдържащи 120 милиарда протона всеки, броят на сблъсъците е 30 милиона сблъсъка в секунда.

Според информация, публикувана на уебсайта на Европейската организация за ядрени изследвания CERN, един милиард сблъсъци в секунда създава поток от данни от 1 петабайт в секунда. И това е най-големият проблем в момента, тъй като поток от данни с такава скорост е просто невъзможно да се съхранява, камо ли да го обработва правилно. „При минимум 30 милиона сблъсъка ни трябват 2000 петабайта, за да съхраним резултатите от типичната 12-часова фаза на колиерите. При 150 изстрелвания на коли на година, ще са необходими 400 000 петабайта, 400 екзабайта данни, за да се съхранят всички данни, огромен обем, който дори не можем да съхраним в момента “, казва Андреас Хокер, учен от ЦЕРН.

Решението на проблема с голямо количество данни е, разбира се, драстично намаляване на техния обем. И това не се прави за сметка на алгоритми за компресиране на информация, тъй като за това няма достатъчно мощност на всички процесори на съществуващи суперкомпютри. Възможностите на компютърната технология, налична в CERN, позволяват да се спестят резултатите от само 1200 сблъсъка за всеки 30 милиона такива случая. Това е 0,004 процента от общия обем, а останалите 99,996 процента, както беше споменато по-горе, се губят завинаги.

Image
Image

Това състояние изглежда като ужасна загуба, но не всичко е толкова тъжно. Явления, които представляват реален интерес за учените, не възникват с тази скорост. Например, бозонът на Хигс се появява със скорост веднъж в секунда, докато други събития се случват със скорост десетки или стотици пъти в секунда. За да се подчертае най-интересното от целия поток от данни, се включват специални „задействащи устройства“, устройства, които извършват предварителна филтриране на данни главно на хардуерно ниво. Тези тригери са разработени за всеки конкретен случай и се настройват в съответствие със свойствата на търсените частици, като бозон на Хигс, истински кварк, W и Z бозони и т.н.

Промоционално видео:

Разбира се, с такова изпълнение на предварителна обработка на данни, част от интересните данни се губят заедно с планина от ненужни и безинтересни „боклуци“. Но останалата информация съдържа главно значими данни, а сравнително скромният й обем вече позволява достатъчно дълбока обработка дори в реално време.

И в заключение трябва да се отбележи, че решението на описания по-горе проблем в никакъв случай не осигурява възможността за съхранение на предимно безполезни данни. Решението на проблема е да се създадат нови сензори за коллайдера, които ще използват най-новите постижения на съвременните технологии и които ще могат да проникнат в дълбините на неизследваните до момента области на физиката. Между другото, някои от тези сензори ще се появят на коллайзера в хода на следващата му модернизация, която се извършва в момента. А изстрелването на модернизирания коллайзер е планирано за 2025 година.

Популярни по теми