Elasticsearch

ELK چیست؟

Elasticsearch قلب زنده چیزی است که امروزه محبوب ترین پلتفرم تجزیه و تحلیل گزارش در جهان است - ELK Stack (Elasticsearch، Logstash، و Kibana). نقشی که Elasticsearch ایفا می کند آنقدر محوری است که با نام خود پشته مترادف شده است. Elasticsearch که عمدتاً برای جستجو و تجزیه و تحلیل گزارش استفاده می شود، امروزه یکی از محبوب ترین سیستم های پایگاه داده موجود است.

Elasticsearch که در ابتدا در سال 2010 منتشر شد، یک موتور جستجو و تجزیه و تحلیل مدرن است که مبتنی بر آپاچی لوسن است. کاملاً منبع باز و ساخته شده با جاوا، Elasticsearch به عنوان یک پایگاه داده NoSQL دسته بندی می شود. Elasticsearch داده ها را به روشی بدون ساختار ذخیره می کند و تا همین اواخر نمی توانستید با استفاده از SQL از داده ها پرس و جو کنید. پروژه جدید Elasticsearch SQL امکان استفاده از دستورات SQL را برای تعامل با داده ها فراهم می کند. می توانید در این مقاله بیشتر در مورد آن بخوانید.

بر خلاف بسیاری از پایگاه‌های داده NoSQL، Elasticsearch تمرکز زیادی بر قابلیت‌ها و ویژگی‌های جستجو دارد – در واقع، تا حدی که ساده‌ترین راه برای دریافت داده‌ها از Elasticsearch جستجوی آن با استفاده از REST API گسترده آن است.

در زمینه تجزیه و تحلیل داده ها، Elasticsearch همراه با سایر مؤلفه های ELK Stack، Logstash و Kibana استفاده می شود و نقش نمایه سازی و ذخیره سازی داده ها را ایفا می کند.

درباره نصب و استفاده از Elasticsearch در آموزش Elasticsearch ما بیشتر بخوانید.

مفاهیم اساسی Elasticsearch

Elasticsearch یک سیستم غنی از ویژگی و پیچیده است. جزئیات و سوراخ کردن هر یک از مهره ها و پیچ ها غیرممکن است. با این حال، برخی از مفاهیم و اصطلاحات اساسی وجود دارد که همه کاربران Elasticsearch باید یاد بگیرند و با آنها آشنا شوند. در زیر شش مفهوم «باید بدانید» برای شروع آورده شده است.

شاخص - Index

شاخص های Elasticsearch پارتیشن های منطقی اسناد هستند و می توانند با یک پایگاه داده در دنیای پایگاه های داده رابطه ای مقایسه شوند.

در ادامه مثال برنامه تجارت الکترونیک ما، می‌توانید یک فهرست Index حاوی تمام داده‌های مربوط به محصولات و دیگری با تمام داده‌های مربوط به مشتریان داشته باشید.

شما می توانید به تعداد دلخواه در Elasticsearch شاخص Index تعریف شده داشته باشید، اما این می تواند بر عملکرد تأثیر بگذارد. اینها به نوبه خود اسنادی را نگه می دارند که برای هر شاخص Index منحصر به فرد هستند.

شاخص‌ Index ها با نام‌های کوچک شناسایی می‌شوند که هنگام انجام اقدامات مختلف (مانند جستجو و حذف) در برابر اسنادی که در داخل هر فهرست هستند استفاده می‌شوند.

اسناد - Documents

اسناد - Documents اشیاء JSON هستند که در یک فهرست Elasticsearch index ذخیره می شوند و واحد پایه ذخیره سازی در نظر گرفته می شوند. در دنیای پایگاه داده های رابطه ای، اسناد را می توان به یک ردیف در یک جدول مقایسه کرد.

در مثال برنامه تجارت الکترونیک ما، می توانید یک سند برای هر محصول یا یک سند برای هر سفارش داشته باشید. هیچ محدودیتی برای تعداد اسنادی که می توانید در یک فهرست خاص ذخیره کنید وجود ندارد.

داده ها در اسناد با فیلدهایی متشکل از کلیدها و مقادیر تعریف می شوند. یک کلید نام فیلد است و یک مقدار می‌تواند آیتمی از انواع مختلف مانند رشته، عدد، عبارت بولی، شیء دیگر یا آرایه‌ای از مقادیر باشد.

اسناد همچنین حاوی فیلدهای رزرو شده هستند که فراداده سند مانند _id , _index , _type را تشکیل می دهند.

Types

انواع Elasticsearch در اسناد برای تقسیم بندی انواع مشابه از داده ها استفاده می شود که در آن هر نوع نشان دهنده یک کلاس منحصر به فرد از اسناد است. انواع شامل یک نام و یک نگاشت (به زیر مراجعه کنید) است و با افزودن فیلد _type استفاده می شود. پس از آن می توان از این فیلد برای فیلتر کردن هنگام پرس و جو یک نوع خاص استفاده کرد.

انواع به تدریج از Elasticsearch حذف می شوند. با شروع Elasticsearch 6، شاخص ها می توانند تنها یک نوع نقشه برداری داشته باشند. با شروع نسخه 7.x، تعیین انواع در درخواست‌ها منسوخ شده است. با شروع نسخه 8.x، تعیین انواع در درخواست‌ها دیگر پشتیبانی نخواهد شد.

Mapping

مانند طرحواره ای در دنیای پایگاه داده های رابطه ای، نگاشت انواع مختلفی را که در یک شاخص قرار دارند، تعریف می کند. این فیلدها را برای اسناد یک نوع خاص تعریف می کند - نوع داده (مانند رشته و عدد صحیح) و نحوه فهرست بندی و ذخیره فیلدها در Elasticsearch.

هنگامی که یک سند با استفاده از الگوها نمایه می شود، می توان به طور صریح تعریف کرد یا به طور خودکار ایجاد کرد. (الگوها شامل تنظیمات و نگاشت هایی هستند که می توانند به طور خودکار در یک فهرست جدید اعمال شوند.)

Shards

اندازه شاخص یکی از دلایل رایج خرابی Elasticsearch است. از آنجایی که محدودیتی برای تعداد اسنادی که می توانید در هر فهرست ذخیره کنید وجود ندارد، ممکن است یک نمایه مقداری از فضای دیسک را اشغال کند که از محدودیت های سرور میزبان بیشتر باشد. به محض اینکه یک شاخص به این حد نزدیک شود، نمایه سازی شروع به شکست می کند.

یکی از راه‌های مقابله با این مشکل این است که شاخص‌ها را به صورت افقی به قطعاتی به نام Shards تقسیم کنیم. این به شما امکان می دهد تا عملیات را در بین Shards ها و گره ها برای بهبود عملکرد توزیع کنید. می‌توانید مقدار Shards های هر فهرست را کنترل کنید و این Shards های «index-like» مشابه هم را در هر گره در خوشه Elasticsearch خود میزبانی کنید.

Replicas

برای اینکه بتوانید به راحتی از خرابی های سیستم مانند خرابی های غیرمنتظره یا مشکلات شبکه بازیابی کنید، Elasticsearch به کاربران اجازه می دهد تا از قطعاتی به نام replica کپی تهیه کنند. از آنجایی که کپی‌ها برای اطمینان از در دسترس بودن بالا طراحی شده‌اند، به همان گره‌ای که از آن کپی شده‌اند اختصاص داده نمی‌شوند. مشابه Shards ها، تعداد کپی‌ها را می‌توان در هنگام ایجاد ایندکس index تعریف کرد، اما در مرحله بعد نیز تغییر داد.

برای اطلاعات بیشتر در مورد این اصطلاحات و مفاهیم اضافی Elasticsearch، مقاله 10 مفهوم Elasticsearch که باید یاد بگیرید را بخوانید.

پرس و جوها - Elasticsearch Queries

Elasticsearch در بالای Apache Lucene ساخته شده است و نحو پرس و جو Lucene را آشکار می کند. آشنایی با نحو و عملگرهای مختلف آن به شما کمک می کند تا در جستجوی Elasticsearch باشید.

Boolean Operators

همانند بسیاری از زبان های کامپیوتری، Elasticsearch از عملگرهای AND، OR و NOT پشتیبانی می کند:

Fields

ممکن است به دنبال رویدادهایی باشید که در آن یک فیلد خاص حاوی عبارات خاصی باشد.

Ranges

می‌توانید فیلدهایی را در یک محدوده خاص جستجو کنید،

age:[3 TO 10] - رویدادهای مربوط به سن بین 3 تا 10 را برمی گرداند
price:{100 TO 400} - رویدادها را با قیمت های بین 101 و 399 برمی گرداند
name:[Adam TO Ziggy] - نام‌هایی را بین آدام و زیگی نشان می‌دهد

Wildcards, Regexes and Fuzzy Searching

با استفاده از کاراکتر * به جای یک یا چندین کاراکتر یا با استفاده از ؟ به جای یک کاراکتر استفاده کنید.

URI Search

ساده ترین راه برای جستجوی خوشه Elasticsearch از طریق جستجوی URI است. شما می توانید یک پرس و جو ساده را با استفاده از پارامتر q query به Elasticsearch ارسال کنید. پرس و جوی زیر کل خوشه شما را برای اسنادی با فیلد نامی برابر با «تراویس» جستجو می کند:

curl “localhost:9200/_search?q=name:travis”

در ترکیب با نحو Lucene، می توانید جستجوهای بسیار چشمگیری ایجاد کنید. معمولا، شما باید کاراکترهایی مانند فاصله ها را با URL رمزگذاری کنید (برای وضوح در این مثال ها حذف شده است):

curl “localhost:9200/_search?q=name:john~1 AND (age:[30 TO 40} OR surname:K*) AND -city”

تعدادی گزینه در دسترس است که به شما امکان می دهد جستجوی URI را سفارشی کنید، به ویژه از نظر اینکه از کدام تحلیلگر استفاده کنید (آنالایزر)، اینکه آیا پرس و جو باید تحمل خطا داشته باشد یا خیر، و اینکه آیا توضیحی در مورد امتیازدهی باید ارائه شود. توضیح).

اگرچه جستجوی URI یک راه ساده و کارآمد برای پرس و جو کردن خوشه شما است، اما به سرعت متوجه خواهید شد که از همه ویژگی های ارائه شده توسط Elasticsearch پشتیبانی نمی کند. قدرت کامل Elasticsearch از طریق Request Body Search آشکار می شود. استفاده از Request Body Search به شما امکان می دهد با استفاده از عناصر مختلف و بندهای پرس و جو، یک درخواست جستجوی پیچیده بسازید که مطابقت، فیلتر، و ترتیب و همچنین دستکاری اسناد بر اساس چندین معیار باشد.

Elasticsearch REST API

یکی از نکات مهم در مورد Elasticsearch REST API گسترده آن است که به شما امکان می دهد داده های نمایه شده را به روش های بی شماری ادغام، مدیریت و پرس و جو کنید. نمونه‌هایی از استفاده از این API برای ادغام با داده‌های Elasticsearch فراوان است که شامل شرکت‌ها و موارد استفاده مختلف می‌شود.

تعامل با API آسان است – می توانید از هر کلاینت HTTP استفاده کنید، اما Kibana دارای ابزار داخلی به نام کنسول است که می تواند برای این منظور استفاده شود.

به همان اندازه که API های Elasticsearch REST گسترده هستند، یک منحنی یادگیری وجود دارد. برای شروع، قراردادهای API را بخوانید، در مورد گزینه‌های مختلفی که می‌توان برای تماس‌ها اعمال کرد، نحوه ساخت API و نحوه فیلتر کردن پاسخ‌ها اطلاعات کسب کرد. نکته خوبی که باید به خاطر بسپارید این است که برخی از API ها از نسخه ای به نسخه دیگر تغییر می کنند و منسوخ می شوند، و این بهترین تمرین خوب است که در مورد شکستن تغییرات توجه داشته باشید.

در زیر برخی از رایج ترین دسته های API Elasticsearch وجود دارد که ارزش تحقیق را دارند. نمونه های استفاده در مقاله Elasticsearch API 101 موجود است. البته، اسناد رسمی Elasticsearch نیز منبع مهمی است.

Elasticsearch Document API

این دسته از APIها برای مدیریت اسناد در Elasticsearch استفاده می شود. برای مثال، با استفاده از این APIها، می توانید اسنادی را در یک فهرست ایجاد کنید، آنها را به روز کنید، آنها را به فهرست دیگری منتقل کنید یا آنها را حذف کنید.

Elasticsearch Search API

همانطور که از نام آن پیداست، از این فراخوانی های API می توان برای جستجوی داده های فهرست شده برای اطلاعات خاص استفاده کرد. APIهای جستجو را می‌توان در سطح جهانی، در همه شاخص‌ها و انواع موجود، یا به‌طور خاص در یک فهرست اعمال کرد. پاسخ ها حاوی موارد منطبق با پرس و جوی خاص خواهند بود.

Elasticsearch Indices API

این نوع API Elasticsearch به کاربران اجازه می دهد تا شاخص ها، نقشه ها و قالب ها را مدیریت کنند. به عنوان مثال، می توانید از این API برای ایجاد یا حذف یک شاخص جدید استفاده کنید، بررسی کنید که آیا یک شاخص خاص وجود دارد یا نه، و یک نقشه برداری جدید برای یک شاخص تعریف کنید.

Elasticsearch Cluster API

اینها فراخوانی های API مخصوص خوشه هستند که به شما امکان می دهند خوشه Elasticsearch خود را مدیریت و نظارت کنید. اکثر APIها به شما امکان می دهند با استفاده از شناسه گره داخلی، نام یا آدرس آن، تعیین کنید کدام گره Elasticsearch را فراخوانی کنید.

Elasticsearch Plugins

پلاگین های Elasticsearch برای گسترش عملکرد اصلی Elasticsearch به روش های مختلف و خاص استفاده می شوند. به عنوان مثال، افزونه هایی وجود دارند که قابلیت های امنیتی، مکانیسم های کشف و قابلیت های تجزیه و تحلیل را به Elasticsearch اضافه می کنند.

صرف نظر از اینکه چه قابلیت هایی اضافه می کنند، افزونه های Elasticsearch به یکی از دو دسته زیر تعلق دارند: افزونه های اصلی یا افزونه های جامعه. اولی به عنوان بخشی از بسته Elasticsearch عرضه می شود و توسط تیم Elastic نگهداری می شود، در حالی که دومی توسط جامعه توسعه می یابد و بنابراین موجودیت های جداگانه ای با چرخه های نسخه سازی و توسعه خاص خود هستند.

دسته بندی افزونه ها

API Extension
Alerting
Analysis
Discovery
Ingest
Management
Mapper
Security
Snapshot/Restore
Store

نصب پلاگین های Elasticsearch

نصب پلاگین های اصلی ساده است و با استفاده از یک مدیر پلاگین انجام می شود. در مثال زیر، من قصد دارم افزونه EC2 Discovery را نصب کنم. این افزونه AWS API را برای لیستی از نمونه های EC2 بر اساس پارامترهایی که در تنظیمات افزونه تعریف می کنید، جستجو می کند:

cd /usr/share/elasticsearch sudo bin/elasticsearch-plugin install discovery-ec2

پلاگین ها باید بر روی هر گره در خوشه نصب شوند و هر گره باید پس از نصب مجدد راه اندازی شود.

برای حذف یک افزونه، از:

sudo bin/elasticsearch-plugin remove discovery-ec2

افزونه های انجمن کمی متفاوت هستند زیرا هر یک از آنها دستورالعمل نصب متفاوتی دارند. برخی از افزونه‌های انجمن مانند افزونه‌های اصلی نصب می‌شوند، اما به مراحل پیکربندی Elasticsearch اضافی نیاز دارند.

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

در مقاله بعدی ساختار Logstash را بررسی خواهیم کرد.

https://enginedevops.com/2022/10/08/what-is-elk-3/

منبع: https://logz.io/learn/complete-guide-elk-stack/#elasticsearch