XPathとは⁉

date_range 2023/06/29
日々の活動日記エンジニアインターン
nature036

みなさん、こんにちは!
京都事業所受託プロダクトチームインターン生の肖かえいです😆
本日はリモートワークで一日業務を行っていました。今日はとにかく暑くてエアコンガンガンで作業を行っていました。
さて、Webスクレイピングの勉強をしていたところXPathという見慣れない単語が出てきました。
なので今日はアウトプットもかねてXMLとは何ぞやということについて解説していきたいと思います。


〇XPathとは

XPathとはずばりXML文書、HTML文書から特定の部分を指定して取得するための簡易言語です。
皆さんご存じのようにHTMLはタグを用いて記入されますが、XPathはそのタグを木のような階層構造としてみなします。


〇XPathの基本的な書き方
じゃあどうやって特定の部分を指定するのという話ですが、"/"をもちいて表していきます。パソコンでファイルを指定するときと同じ形式といえば想像できると思います!要素に含まれるテキストを表示したいときはtext()を使います


<例 htmlで要素を指定するとき>
   html/head/title/text()


〇最後に
Webスクレイピングを行う際、膨大な量のソースコードから特定の要素を探すのは本当に骨が折れます。
今回勉強したXPathを有効活用していきたいですね!
---------------------------------------------------------------------------------------------
インターン募集ページ: https://guardian.jpn.com/recruit/intern/
メンバー紹介ページ:https://guardian.jpn.com/member/Xiao_Kaei/
~☆新事業☆Webサイトを育てるサブスクサービスはこちら~
https://guardian.jpn.com/service/subscription/
---------------------------------------------------------------------------------------------


*COMMENT*

    *コメント*

    *ログイン*

    メールアドレス
    パスワード