Cum se instalează Apache Kafka pe Ubuntu 20.04


Ghid Detaliat pentru Instalarea Apache Kafka pe Ubuntu 20.04

Apache Kafka reprezintă o platformă de tip open-source, concepută pentru fluxuri de date distribuite, având capacitatea de a procesa volume impresionante de informații în timp real. Această platformă se remarcă prin toleranța la erori, scalabilitatea ridicată și performanțele superioare, fiind ideală pentru aplicații de importanță critică, precum analiza datelor live, procesarea fluxurilor de date și integrarea informațiilor. În cadrul acestui ghid, vă vom prezenta pașii necesari pentru a instala Apache Kafka pe un sistem Ubuntu 20.04.

Condiții Prealabile

Înainte de a demara procesul de instalare, asigurați-vă că sistemul dumneavoastră îndeplinește următoarele cerințe minime:

  • Sistem de operare: Ubuntu 20.04
  • Java Runtime Environment (JRE), versiunea 11 sau una superioară
  • Python, versiunea 2.7 sau o versiune mai nouă

Instalarea Java Runtime Environment (JRE)

Dacă JRE nu este deja instalat, puteți folosi următoarele comenzi pentru a instala OpenJDK 11:

  
   sudo apt update
   sudo apt install openjdk-11-jre
  
  

Procesul de Instalare Apache Kafka

Descărcarea Pachetului Apache Kafka

Accesați pagina oficială de descărcare Apache Kafka și obțineți cea mai recentă variantă stabilă a platformei. La momentul redactării acestui material, versiunea curentă este 3.3.1.

Extragerea Arhivei Kafka

După descărcarea arhivei, dezarhivați conținutul într-un director nou. Puteți realiza acest lucru utilizând comanda de mai jos:

  
  tar -xzvf kafka_2.13-3.3.1.tgz
  
  

Această acțiune va crea directorul kafka_2.13-3.3.1.

Definirea Variabilelor de Mediu

Adăugați variabilele de mediu de mai jos la fișierul /etc/profile:

  
  export KAFKA_HOME=/opt/kafka
  export PATH=$PATH:$KAFKA_HOME/bin
  
  

Salvați modificările și închideți fișierul.

Actualizați variabilele de mediu cu următoarea comandă:

  
  source /etc/profile
  
  

Configurarea Apache Kafka

Crearea Directoarelor pentru Date și Jurnale

Kafka stochează datele și jurnalele în directoare dedicate. Creați următoarele directoare:

  
  sudo mkdir -p /var/lib/kafka/data
  sudo mkdir -p /var/log/kafka
  
  

Modificați proprietarul și permisiunile directoarelor, după cum urmează:

  
  sudo chown -R kafka:kafka /var/lib/kafka
  sudo chown -R kafka:kafka /var/log/kafka
  
  

Editarea Fișierului de Configurare Kafka

Modificați fișierul de configurare server.properties, localizat în directorul config din cadrul directorului de instalare Kafka:

  
  sudo nano $KAFKA_HOME/config/server.properties
  
  

Adăugați sau modificați următoarele proprietăți în fișier:

    

# Adresa de ascultare a serverului Kafka listeners=PLAINTEXT://:9092 # Directorul unde sunt stocate datele log.dirs=/var/lib/kafka/data # Directorul unde sunt stocate jurnalele log.dirs=/var/log/kafka # Numărul de partiții pentru fiecare topic nou num.partitions=1 # Factor de replicare pentru fiecare topic nou replication.factor=1 # ID-ul brokerului broker.id=0

Salvați modificările și închideți fișierul.

Crearea Utilizatorului Kafka

Creați un utilizator dedicat pentru execuția Kafka:

  
  sudo useradd -r -m -U -d /opt/kafka -s /bin/bash kafka
  
  

Lansarea Apache Kafka

Pornirea Brokerului Kafka

Porniți brokerul Kafka utilizând comanda de mai jos:

  
  sudo /opt/kafka/bin/kafka-server-start.sh /opt/kafka/config/server.properties &
  
  

Verificarea Stării Kafka

Pentru a verifica dacă Kafka funcționează, folosiți următoarea comandă:

  
  jps | grep Kafka
  
  

Ar trebui să apară un proces denumit Kafka, indicând funcționarea corectă a serviciului.

Concluzie

Felicitări! Ați instalat cu succes Apache Kafka pe sistemul dumneavoastră Ubuntu 20.04. Platforma este acum operațională și pregătită pentru procesarea și managementul unor cantități mari de date în timp real. Datorită capacității de scalare, toleranței la erori și performanțelor ridicate, Kafka reprezintă o soluție excelentă pentru o gamă largă de aplicații centrate pe date. Puteți începe acum să creați și să gestionați topicuri, să produceți și să consumați mesaje, valorificând la maxim puterea fluxurilor de date prin Apache Kafka.

Întrebări Frecvente

1. Ce este Apache Kafka?

Apache Kafka este o platformă distribuită de streaming, destinată administrării datelor în timp real.

2. Care sunt cerințele de bază pentru instalarea Kafka?

Ubuntu 20.04, JRE versiunea 11 sau o versiune superioară, și Python versiunea 2.7 sau o versiune mai recentă.

3. Cum verific dacă Kafka este instalat corect?

Executați comanda jps | grep Kafka și verificați dacă procesul Kafka este în execuție.

4. Cum configurez fișierul de configurare Kafka?

Modificați fișierul server.properties, situat în directorul config, adaptând proprietățile conform necesităților dumneavoastră.

5. Cum pornesc brokerul Kafka?

Utilizați comanda sudo /opt/kafka/bin/kafka-server-start.sh /opt/kafka/config/server.properties &.

6. Cum creez un utilizator dedicat pentru rularea Kafka?

Rulați comanda sudo useradd -r -m -U -d /opt/kafka -s /bin/bash kafka.

7. De unde descarc ultima versiune de Kafka?

Vizitați site-ul oficial de descărcare Apache Kafka la https://kafka.apache.org/downloads.

8. Unde găsesc mai multe informații despre Kafka?

Consultați documentația oficială Kafka la https://kafka.apache.org/documentation.