Analizować XML, aby uzyskać wartość węzła w skrypcie bash?

Chciałbym wiedzieć, jak uzyskać wartość węzła z następującymi ścieżkami:

config/global/resources/default_setup/connection/host config/global/resources/default_setup/connection/username config/global/resources/default_setup/connection/password config/global/resources/default_setup/connection/dbname 

z następującego kodu XML:

<?xml version="1.0"?> <config> <global> <install> <date><![CDATA[Tue, 11 Dec 2012 12:31:25 +0000]]></date> </install> <crypt> <key><![CDATA[70e75d7969b900b696785f2f81ecb430]]></key> </crypt> <disable_local_modules>false</disable_local_modules> <resources> <db> <table_prefix><![CDATA[]]></table_prefix> </db> <default_setup> <connection> <host><![CDATA[localhost]]></host> <username><![CDATA[root]]></username> <password><![CDATA[pass123]]></password> <dbname><![CDATA[testdb]]></dbname> <initStatements><![CDATA[SET NAMES utf8]]></initStatements> <model><![CDATA[mysql4]]></model> <type><![CDATA[pdo_mysql]]></type> <pdoType><![CDATA[]]></pdoType> <active>1</active> </connection> </default_setup> </resources> <session_save><![CDATA[files]]></session_save> </global> <admin> <routers> <adminhtml> <args> <frontName><![CDATA[admin]]></frontName> </args> </adminhtml> </routers> </admin> </config> 

Chciałbym również przypisać tę wartość zmiennej do dalszego wykorzystania. Przedstaw mi swój pomysł.

Komentarze

Odpowiedź

Używając bash i xmllint (zgodnie z tagami):

xmllint --version # xmllint: using libxml version 20703 # Note: Newer versions of libxml / xmllint have a --xpath option which # makes it possible to use xpath expressions directly as arguments. # --xpath also enables precise output in contrast to the --shell & sed approaches below. #xmllint --help 2>&1 | grep -i "xpath" 

{ # the given XML is in file.xml host="$(echo "cat /config/global/resources/default_setup/connection/host/text()" | xmllint --nocdata --shell file.xml | sed "1d;$d")" username="$(echo "cat /config/global/resources/default_setup/connection/username/text()" | xmllint --nocdata --shell file.xml | sed "1d;$d")" password="$(echo "cat /config/global/resources/default_setup/connection/password/text()" | xmllint --nocdata --shell file.xml | sed "1d;$d")" dbname="$(echo "cat /config/global/resources/default_setup/connection/dbname/text()" | xmllint --nocdata --shell file.xml | sed "1d;$d")" printf "%s\n" "host: $host" "username: $username" "password: $password" "dbname: $dbname" } # output # host: localhost # username: root # password: pass123 # dbname: testdb 

W przypadku, gdy istnieje tylko ciąg XML i należy unikać użycia pliku tymczasowego, deskryptory plików są najlepszym rozwiązaniem w przypadku xmllint (który jest tutaj podany jako /dev/fd/3 jako argument plikowy):

set +H { xmlstr="<?xml version="1.0"?> <config> <global> <install> <date><![CDATA[Tue, 11 Dec 2012 12:31:25 +0000]]></date> </install> <crypt> <key><![CDATA[70e75d7969b900b696785f2f81ecb430]]></key> </crypt> <disable_local_modules>false</disable_local_modules> <resources> <db> <table_prefix><![CDATA[]]></table_prefix> </db> <default_setup> <connection> <host><![CDATA[localhost]]></host> <username><![CDATA[root]]></username> <password><![CDATA[pass123]]></password> <dbname><![CDATA[testdb]]></dbname> <initStatements><![CDATA[SET NAMES utf8]]></initStatements> <model><![CDATA[mysql4]]></model> <type><![CDATA[pdo_mysql]]></type> <pdoType><![CDATA[]]></pdoType> <active>1</active> </connection> </default_setup> </resources> <session_save><![CDATA[files]]></session_save> </global> <admin> <routers> <adminhtml> <args> <frontName><![CDATA[admin]]></frontName> </args> </adminhtml> </routers> </admin> </config> " # exec issue #exec 3<&- 3<<<"$xmlstr" #exec 3<&- 3< <(printf "%s" "$xmlstr") exec 3<&- 3<<EOF $(printf "%s" "$xmlstr") EOF { read -r host; read -r username; read -r password; read -r dbname; } < <( echo "cat /config/global/resources/default_setup/connection/*[self::host or self::username or self::password or self::dbname]/text()" | xmllint --nocdata --shell /dev/fd/3 | sed -e "1d;$d" -e "/^ *--* *$/d" ) printf "%s\n" "host: $host" "username: $username" "password: $password" "dbname: $dbname" exec 3<&- } set -H # output # host: localhost # username: root # password: pass123 # dbname: testdb 

Komentarze

Odpowiedź

Chociaż jest już wiele odpowiedzi, będę dzwonić za pomocą xml2.

$ xml2 < test.xml /config/global/install/date=Tue, 11 Dec 2012 12:31:25 +0000 /config/global/crypt/key=70e75d7969b900b696785f2f81ecb430 /config/global/disable_local_modules=false /config/global/resources/db/table_prefix /config/global/resources/default_setup/connection/host=localhost /config/global/resources/default_setup/connection/username=root /config/global/resources/default_setup/connection/password=pass123 /config/global/resources/default_setup/connection/dbname=testdb /config/global/resources/default_setup/connection/initStatements=SET NAMES utf8 /config/global/resources/default_setup/connection/model=mysql4 /config/global/resources/default_setup/connection/type=pdo_mysql /config/global/resources/default_setup/connection/pdoType /config/global/resources/default_setup/connection/active=1 /config/global/session_save=files /config/admin/routers/adminhtml/args/frontName=admin 

Przy odrobinie magii możesz nawet ustawić je bezpośrednio jako zmienne:

Odpowiedź

Korzystanie z xmllint i opcja –xpath , jest to bardzo proste. Możesz po prostu zrobić to:

XML_FILE=/path/to/file.xml HOST=$(xmllint --xpath "string(/config/global/resources/default_setup/connection/host)" $XML_FILE USERNAME=$(xmllint --xpath "string(/config/global/resources/default_setup/connection/username)" $XML_FILE PASSWORD=$(xmllint --xpath "string(/config/global/resources/default_setup/connection/password)" $XML_FILE DBNAME=$(xmllint --xpath "string(/config/global/resources/default_setup/connection/dbname)" $XML_FILE 

Jeśli potrzebujesz dostać się do atrybutu elementu, jest to również łatwe przy użyciu XPath. Wyobraź sobie, że masz plik:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> <addon name="Turn Off" version="0.10.0" provider-name="Dag Wieërs"> ..snip.. </addon> 

Potrzebne instrukcje powłoki wyglądałyby następująco:

VERSION=$(xmllint --xpath "string(/addon/@version)" $ADDON_XML) AUTHOR=$(xmllint --xpath "string(/addon/@provider-name)" $ADDON_XML) 

Odpowiedź

Poniższe działa, gdy zostanie porównane z danymi testowymi:

{ read -r host; read -r username; read -r password; read -r dbname; } \ < <(xmlstarlet sel -t -m /config/global/resources/default_setup/connection \ -v ./host -n \ -v ./username -n \ -v ./password -n \ -v ./dbname -n) 

Spowoduje to umieszczenie treści w zmiennych host, username, password i dbname.

Komentarze

  • xmlstarlet: polecenie nie zostało znalezione, więc to polecenie nie jest dla mnie przydatne: (
  • @MagePsycho bash nie ma żadnej wbudowanej obsługi analizowania XML. Musisz też mieć narzędzie, które to robi (xmlstarlet, xsltproc, nowoczesny Python itp.) lub możesz ' t poprawnie przeanalizować XML.
  • @CharlesDuffy czy istnieje sposób, aby uzyskać wartość, używając wzorca wyrażenia regularnego, czy też?
  • @MagePsycho możesz po prostu zainstalować xmlstarlet. W każdym razie nigdy nie używaj regul ar do parsowania (X) HTML .
  • @MagePsycho Miałem właśnie opublikować ten sam link, który już zrobił terdon. W skrócie: nie.

Odpowiedź

Czysty bash funkcji, tylko w niefortunnym przypadku, gdy nie możesz zainstalować niczego odpowiedniego. To może i prawdopodobnie zawiedzie w przypadku bardziej skomplikowanego XML:

 function xmlpath() { local expr="${1//\// }" local path=() local chunk tag data while IFS="" read -r -d "<" chunk; do IFS=">" read -r tag data <<< "$chunk" case "$tag" in "?"*) ;; "!–-"*) ;; "![CDATA["*) data="${tag:8:${#tag}-10}" ;; ?*"/") ;; "/"?*) unset path[${#path[@]}-1] ;; ?*) path+=("$tag") ;; esac [[ "${path[@]}" == "$expr" ]] && echo "$data" done }  

Użycie :

bash-4.1$ xmlpath "config/global/resources/default_setup/connection/host" < MagePsycho.xml localhost 

Znane problemy:

  • wolno
  • wyszukuje tylko według nazw tagów
  • bez dekodowania jednostek znaków

Odpowiedź

W tym komentarzu użyto tylko poleceń i metod sh / bash! /test.xml to Twój plik typu XML na pierwsze pytanie …

#!/bin/sh cat /test.xml | while read line;do [ "$(echo "$line" | grep "<host>")" ]&& echo "host: $(echo $line | cut -f3 -d"[" | cut -f1 -d"]")" [ "$(echo "$line" | grep "<username>")" ]&& echo "username: $(echo $line | cut -f3 -d"[" | cut -f1 -d"]")" [ "$(echo "$line" | grep "<password>")" ]&& echo "password: $(echo $line | cut -f3 -d"[" | cut -f1 -d"]")" [ "$(echo "$line" | grep "<dbname")" ]&& echo "dbname: $(echo $line | cut -f3 -d"[" | cut -f1 -d"]")" done 

Wyjście:

host: localhost username: root password: pass123 dbname: testdb 

jeśli chcesz zapisać te wartości do pliku, użyj tej metody:

#!/bin/sh cat /test.xml | while read line;do [ "$(echo "$line" | grep "<host>")" ]&& echo "$line" | cut -f3 -d"[" | cut -f1 -d"]" > /config/global/resources/default_setup/connection/host [ "$(echo "$line" | grep "<username>")" ]&& echo "$line" | cut -f3 -d"[" | cut -f1 -d"]" > /config/global/resources/default_setup/connection/username [ "$(echo "$line" | grep "<password>")" ]&& echo "$line" | cut -f3 -d"[" | cut -f1 -d"]" > /config/global/resources/default_setup/connection/password [ "$(echo "$line" | grep "<dbname")" ]&& echo "$line" | cut -f3 -d"[" | cut -f1 -d"]" > /config/global/resources/default_setup/connection/dbname done 

ta metoda nadpisze twoje lokalne pliki używane tylko do pobierania wartości (twoje dane zostaną utracone z plików wyjściowych)

Odpowiedź

Możesz skorzystać z kodowania interfejsu wiersza poleceń php w skryptach basha, aby obsłużyć kilka złożonych skrypty, które w rzeczywistości obejmują wiele linii kodu. Najpierw spróbuj stworzyć swoje rozwiązanie za pomocą skryptów PHP, a później przekaż parametry w trybie CLI. W ten sposób możesz uzyskać kontrolę nad doskonałymi zastosowaniami parserów XML.

Wygląda na to, że środowisko PHP można używać w trybie klienta przez dostęp do powłoki ssh /.

php -f yourxmlparser.php 

Teraz wykonaj wszystkie czynności w pliku php. Skorzystaj z parametrów wiersza poleceń, jakie może on przyjąć.

Możesz nawet przypisać te zwracane wartości do środowiska Shell, aby kontynuować działanie pozostałych skryptów powłoki.

Innym sposobem jest użycie | grep, aby dopasować wymaganą wartość w pliku xml, jeśli jesteś całkiem pewien, że struktura pliku xml nie zmienia się w czasie.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *