Как да визуализирам сложни данни в Linux

Вероятно сте чували за Elasticsearch - търсачката, която ви позволява да индексирате и след това бързо да търсите в данните си. Може да сте създали няколко визуализации в Kibana, GUI за Elasticsearch, насочвайки и кликвайки си през елегантния интерфейс.

Това, което може да не сте използвали, е по-малко известен плъгин за визуализация, наречен Timelion.

Timelion е фантастичен инструмент за създаване на визуализация, който прави възможно изписването на вашите заявки на неговия прост и мощен език за изразяване, за да се показват графики. Използва се за показване на данни от времеви редове, като прираст на населението или посещения на вашия уебсайт.

  • Ето списък с най-добрите лаптопи за разработчици
  • Проверете тези най-добри дистрибуции за разработчици
  • Смачкайте числата с лекота на тези най-добри работни станции
Относно тази статия

Тази статия се появи за първи път в списание Linux Format, брой # 269, публикувано през ноември 2022-2023 г.

С Timelion можем да изчислим пълзящи средни стойности, да покажем разликата между данните за миналата седмица и днес и да извършим някои основни открития на аномалии. Това е полезен инструмент, с който да знаете как да работите. Да започваме.

Инсталация

Ако сте обикновен четец на формат на Linux, има примери за съставяне на докер за настройване на клъстер в LXF261.

В противен случай инсталирането на Elasticsearch и Kibana е относително лесно. Единственото изискване е Java, която може би вече сте инсталирали.

Ако не просто sudo apt install default-jre го инсталира на базираните на Debian дистрибуции или sudo dnf install java трябва да направи същото за семейството дистрибуции на Red Hat.

След това просто трябва да изтеглите най-новата версия на Elasticsearch и Kibana за желания от вас вкус на операционната система.

Към момента на писане на последната версия е kibana-7.8.1-linux-x86_64.tar.gz.

Можете да го извлечете с tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, да промените в извлечената директория и да стартирате ./bin/kibana &, за да задействате екземпляра Kibana.

Когато сте направили абсолютно същите стъпки, за да настроите Elasticsearch, замествайки 'kibana' с 'elasticsearch', трябва да можете да навигирате до http: // localhost: 5601 в любимия си браузър и да видите нов лъскав интерфейс на Kibana за игра наоколо с.

Ако предпочитате да инсталирате пакети с мениджър на пакети, същата връзка като преди има информация за добавяне на Elastic repo към вашата система и инсталиране на пакетите Kibana и Elasticsearch по този начин.

Можете да наслагвате графики една върху друга и да използвате форматиране, за да накарате графиките да изглеждат най-добре.

Вземете някои данни

Последните версии на Kibana правят възможно автоматичното поглъщане на набори от данни в нашия клъстер с визуализатора на данни, вместо да се налага да създавате скрипт или конфигурация на Logstash. Той може да се справя с набори от данни в JSON или CSV формат, както и с някои стандартни регистрационни файлове, като дневници на Apache. Единственото ограничение е, че те са по-малки от 100 MB. Това е повече от достатъчно за нашите цели.

Ще използваме световния набор от данни за случаи Covid-19 от портала за отворени данни на ЕС. Изтеглихме CSV файла от раздела Ресурси на страницата.

Ако имате проблеми, можете вместо това да изтеглите версията на Excel .xlsx, да отворите с LibreOffice Calc и да го запазите като текстов CSV (.csv) формат. Има и версия на JSON за изтегляне, която можете да използвате като алтернатива.

За да стигнете до визуализатора на данни в Кибана, щракнете върху иконата на хамбургер в горния ляв ъгъл, след това машинно обучение и накрая визуализатор на данни. След като щракнете върху Качване на файл в полето Импортиране на данни, след това изберете или плъзнете и пуснете файл и изберете вашия CSV файл за поглъщане.

След кратък анализ той ще покаже някои статистически данни, които е открит от първите 1000 реда на CSV файла. Това ще бъде форматът, за който смята, че е всяко от полетата, като текст, дата или номер и ще подчертае най-добрите стойности, намерени в полетата.

Обикновено върши добра работа, като разбере това за нас. Ако трябва да направите някакви корекции, можете да щракнете върху Замяна на настройките, за да ги промените - например името на полето, както ще бъде зададено в Elasticsearch.

Едно име на поле, което трябва да заменим, е dateRep, която представлява датата за изчислената цифра в нашия набор от данни. Timelion няма да знае как да използва това като поле за време по подразбиране, така че можем да опростим живота си по-късно, като го преименуваме сега на нещо, което той ще разпознае.

Един добър кандидат е клеймо за време. Щракнете върху Приложи, за да зададете това. Когато сте доволни от това как изглежда останалата част, щракнете върху Импортиране в долната част, дайте име на индекса - избрахме covid - и след това щракнете върху Импортиране отново, за да получите данните във вашия клъстер.

Интересни статии...