Step 3 (S-102154)

From Stepik Wiki
Jump to: navigation, search

Step on Stepik: https://stepik.org/lesson/24474/step/3

Step 3 (S-102154) 1.png

[00:00 - 00:18] мы можем вспомнить прошлое мл казалось бы язык разметки гипертекста также является также внутри тегов мы также используем атрибуты точно так же мы делаем это в xml а между открывающим и закрывающим тэгом у нас чаще всего помещается либо текст либо другие то почему мы можем использовать те же механизмы разбор которые мы используем для


[00:18 - 00:36] xml для того чтобы разбирать данные в формате html или таковы что большей части интернет трафика форматишь тем является блока сформированы то есть может оказаться так что та которую мы открыли мы никогда даже не закроем мы можем закрывать такие в неправильном порядке но при этом браузер сразу удается как то отображать страницу


[00:36 - 00:54] поэтому для работы с реальными файлами чаще всего используют сторонние библиотеки это библиотеке beautiful soup и аксиомой давайте рассмотрим пример того как мы можем разбираться с темой страницу например библиотеки латекса мы прежде всего что интересно голосовым будем также импортировать библиотеку и 3


[00:54 - 01:12] это связано прежде всего с тем что пытается вести себя в точности так же как встроенная в питон язык библиотека элемент 3 и сейчас мы в этом убедимся сначала мы сделаем запрос на официальной странице документации опасен этика и к власти и конта то что вы видите


[01:12 - 01:27] затем мы создадим парсер а штемпель парсер который находится внутри библиотеки xml именно этот парсер является той самой умной часть елок смайлик который отличается во снах нибудь языка python


Step 3 (S-102154) 2.png

[01:27 - 01:45] он позволит нам работать с теми данными в формате html который является плохо сформированными затем мы с ним функцию from стринг из нашей библиотеки из xml когда мы передадим наши данные в формате html и в древнем парсер который является парсером изданий для тебя это нам также вернет


[01:45 - 02:04] корень нашего дерева для берем всех элементов потерю нашего корни которой является атрибутом а мы увидим на экранах даны элементы их атрибуты данный код исполним всего убедимся в том что статус кво 200 мы смогли получить страницу что данная страница нам возвращается в формате html


Step 3 (S-102154) 3.png

[02:04 - 02:21] где мы увидим все элементы а которая находится в поддержку нашего корня но что самое главное мы увидим их атрибуты и почти в каждом из них вы не могли бы хрень которая и является той самой ссылкой которые пытались найти таким образом благодаря является максимально мы смогли произвести разбор нашего с темой файла


Step 3 (S-102154) 4.png

Step 3 (S-102154) 5.png

[02:21 - 02:31] так же как мы делаем для xml файл мы считаю что мне давить на структуру выдели корень я внутри по дереву все элементы с тэгом а