Kafe-sviaz.ru

Финансовый журнал
10 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Анализ информационных ресурсов сети интернет

Основные информационные ресурсы ИНТЕРНЕТ.

Человек, получивший доступ к Интернету, попадает в мир практически неограниченных информационных ресурсов. Следует учитывать, что некоторые ресурсы могут быть платными. Ниже приводится очень краткий обзор основных ресурсов сети.

1) Электронная почта.

Электронная почта, или e-mail (от electronic mail- электронная почта), представляет собой один из способов связи между людьми. Она объединяет в себе все достоинства почты, телетайпа, телеграфа и факса. Причем пересылка по электронной почте обходится дешевле, чем услуги каждого из рассмотренных средств связи.

Пример адреса электронной почты: sas@.isuct.interline.ivanovo.ru

В рассматриваемом примере sas – идентификатор абонента, составляемый, как правило, из начальных букв его фамилии, имени, отчества. То, что стоит справа от знака @, называется доменом и однозначно описывает местонахождение абонента.@ — обязательный символ в адресе e-mail.

2) Всемирная Паутина.

Наверное, самым интересным, удобным и эффективным ресурсом, который пользуется в настоящее время огромной популярностью, является гипертекстовая сетевая информационная система World Wide Web (всемирная паутина). Всемирная паутина, которую для краткости называют Web или WWW, представляет собой гипертекстовую (более точно гипермедийную) информационную систему, содержащую связанную между собой ссылками документы, которые могут создаваться в различных программных средах и находиться в любом из компьютеров Интернета.

Гипертекст можно рассматривать как текст, содержащий ссылки, которые связаны с определением, пояснением, дополнений отдельных слов, словосочетаний, изображений, входящих в рассматриваемый текст. Важнейшим свойством гипертекста является автоматический доступ к информации, связанной с указываемой пользователем ссылкой. Поиск этой информации и ее вывод на экран осуществляется с помощью специальных программ работы с гипертекстами.

3) Адрес ресурса.

Каждая web-страница с точки зрения операционной системы представляет собой файл, находящийся на одном из дисковых устройств компьютера, играющего роль web-сервера. Следовательно, для того чтобы получить доступ к какой либо web-странице, нужно тем или иным способом указать на файл, хранящий эту страницу.

sunsite.unc.edu – доменный адрес компьютера

4) Электронные доски объявлений.

На электронных досках объявлений (в литературе часто используется сокращение BBS от Bulletin Board System — система досок объявлений) размещаются объявления, которые посылаются пользователями всем, кто их прочитает. Электронные доски являются аналогом обычных досок объявлений, которые размещаются в общедоступных, часто посещаемых людьми местах. Можно также провести аналогию с объявлениями, печатаемыми в газетах и журналах.

На базе программ электронной почты, электронных досок объявлений и других специальных пакетов проводятся деловые совещания, научные конференции, в которых могут участвовать несколько человек, находящихся на своих рабочих местах в разных городах или странах.

6) Пересылка файлов.

Пересылаемые по сети сообщения могут состоять только из кодов ASCII. Однако, присоединив любой файл к сообщению, его также можно переслать по сети, но только в автономном (offline) режиме. В Интернете существует другой способ пересылки произвольных файлов между компьютерами. Этот способ основан на протоколе FTP (File transfer Protocol – протокол передачи файлов), который подразумевает передачу файлов в так называемом оперативном, или online, режиме. Это означает, что на время передачи файла передающий и принимающий компьютеры должны находиться в прямом контакте друг с другом (как люди, разговаривающие друг с другом по телефону).

7) Удаленный доступ.

Протокол FTP является достаточно мощным, но вместе с тем и ограниченным средством доступа к ресурсам «чужих» компьютеров сети. Он обеспечивает только копирование, то есть пересылку копий файлов от одного компьютера сети к другому. Полноценный доступ к ресурсам компьютеров, входящих в Интернет, обеспечивает протокол telnet (TErminaL over NETwork protocol – протокол удаленного доступа). С помощью этого протокола пользователь может подключиться к компьютеру, который находится на противоположной стороне земного шара, и работать с ним, как со своим персональным компьютером.

8) Поиск серверов.

Как было отмечено выше, для того чтобы пользоваться протоколами ftp или telnet, необходимо знать доменный адрес соответствующего сервера. Если же такой адрес неизвестен, то доступ к необходимому ресурсу может быть существенно затруднен. Для облегчения поиска нужных серверов в Интернете была разработана основанная на принципах меню система доступа к серверам Интернета. Эта система получила название GOPHER. Термин происходи то ли от слова gopher – суслик (Миннесота, родина этой системы, считается штатом «золотых сусликов»), то ли от жаргонного термина go fer – рыщущий человек.

9) Базы данных в Интернете.

К Интернету подключено большое количество баз данных, содержащих огромное количество информации по самым различным вопросам: от сведений по конкретным наукам – биологии, математике, физике — до коллекции анекдотов и небылиц. Как правило, они входят в состав информационной системы широкого пользования WAIS (Wide Area Information System). Компьютер, имеющий специальное программное обеспечение и предоставляющий пользователям доступ к базам данных этой системы, называют wais-сервером.

WAIS объединяет wais-серверы всего мира, имеющие доступ к более чем 1000 общедоступных и коммерческих баз данных. Для доступа к WAIS нужно знать домашний адрес какого-либо конкретного wais-сервера.

63. WWW-информационная паутина: система имен в Интернет, доменное имя и IP-адрес.

WWW (Всемирная информационная сеть, «паутина») использует Internet для передачи гипертекстовых документов – документов содержащих текстовую, мультимедийную информацию, а также ссылки на другие документы – от сервера, на котором эти документы находятся, к компьютеру пользователя. Это наиболее распространенный и популярный сервис.

WWW отличается двумя особенностями:

1. использованием гипертекста;

2. возможность клиентов взаимодействовать с другими приложениями Internet.

3. Для работы с WWW на клиентских компьютерах используются программы-браузеры. Задача браузера – показать пользователю указанный им документ. Программа-браузер может выполнять следующие действия:

4. просматривать документы, находящиеся на удаленных компьютерах-серверах, осуществляя к ним доступ через Internet;

5. просматривать как текстовые, так и гипертекстовые документы;

6. давать возможность пользователю проследовать по ссылкам к другим документам, создавая явление продолжительного «брожения» по ресурсам WWW.

Гипертекстовые документы пишутся с помощью специального языка HTML (Hyper Text Mark-up Language – язык разметки гипертекста). Изображения и другие нетекстовые компоненты не вставляются в документ непосредственно и хранятся отдельно. Вместо этого в текст вставляется ссылка, указывающая имя файла, содержащего необходимый компонент.

Несколько документов, объединенных на одном сервере какой-либо общей темой, называют домашней страницей (home page).

Более крупный ресурс называется сайтом (site). Сайт может объединять несколько серверов; с другой стороны, на одном мощном сервере может размещаться несколько сайтов.

Для доступа к документу необходимо указать его адрес, который называется URL (Uniform Resource Locator – универсальный указатель ресурса) – это строка символов, обозначающая документ или ресурс, запрашиваемых пользователем Всемирной паутины. Чтобы получить доступ к нужному ресурсу или документу, достаточно ввести его адрес URL в поле ввода браузера. Формат URL стандартизован, поэтому он распознается всеми программами просмотра. Структура адреса URL имеет следующий вид:

где определяет метод доступа к ресурсу. представляет собой сетевое имя компьютера, на котором находятся искомые данные. — путь к искомому файлу с указанием каталогов (папок) и имени файла.

Пример URL: http://citforum.ru/seminars/cis99.html.

http:// — указание браузеру применить сетевой протокол HTTP, предназначенный для работы с WWW;

citforum.ru – доменное имя компьютера в Internet (сервера WWW), на котором находится искомый документ;

/seminars/cis99.html – путь к искомому файлу.

При обращении браузера по указанному URL компьютер-адресат должен отвечать следующим требованиям:

· быть в работоспособном состоянии;

· иметь запущенную программу, которая ожидает этого обращения.

Система имен (адресов) в Internet

Каждый компьютер в Internet должен иметь свой собственный уникальный адрес, позволяющий связаться с ним любому другому компьютеру сети. Индивидуальный адрес каждого компьютера в Internet имеет наименование – IP-адрес. IP-адреса имеют две формы записи:

· цифровой (числовой) адрес;

Оба адреса могут применяться равноценно.

Цифровой адрес имеет длину 32 бита; для удобства он разделяется на четыре блока по 8 бит в каждом, которые можно записывать в десятичном виде. Цифровой адрес включает в себя три компонента:

· адрес компьютера в подсети.

Например, IP-адрес может иметь вид: 142.25.6.170, где:

142.25 – адрес сети; 6 – адрес подсети; 170 – адрес компьютера.

Цифровой адрес содержит полную информацию, необходимую для идентификации компьютера.

Цифровая форма адреса используется компьютерами и специальным оборудованием обслуживания сети; для пользователей цифровой адрес неудобен, плохо запоминается и несет мало смысловой информации.

В связи с неудобством использования адресации в цифровом виде была изобретена доменная система имен компьютеров, представленных в Internet.

Доменное имя состоит из нескольких слов или сокращений, разделенными точками, например: irgups.ru. Доменное имя несет полезную информацию о местонахождении компьютера. Количество символов в имени домена ограничено числом 63.

Читать еще:  Анализ изучающий экономические явления и процессы

Доменное имя имеет иерархическую многоуровневую структуру:

Ø крайняя правая часть имени обозначает домен верхнего уровня, то есть самую большую группу компьютеров, в которой находится данный компьютер. В данном примере это ru – сокращенное от Russia; этот домен объединяет компьютеры, подключенные к Internet в России;

внутри доменов верхнего уровня есть поддомены – домены второго и более уровней;

крайняя левая часть доменного имени обозначает имя компьютера внутри своего поддомена.

Домены первого (верхнего) уровня бывают трехбуквенные и двухбуквенные. Трехбуквенные: com, edu, gov, org и др. Двухбуквенные домены верхнего уровня обозначают его страну расположения: ru, ua, jp и др.

Преобразование доменного имени в цифровой IP-адрес осуществляется специальной службой Internet, называемой DNS (Domain Name System – Система доменных имен). Компьютеры, выполняющие такое преобразование, называются DNS-серверами.

Анализ и разработка информационных ресурсов Internet

Курсовая работа По дисциплине: Сетевые информационные ресурсы

Выполнил: Студент гр. ДО-6-005

Ростовский государственный университет путей сообщения (РГУПС)

г. Ростов-на-Дону 2007

Сегодня невозможно обойтись без помощи компьютера, и соответственно Интернета. Появление Интернет начинается с 1969 года. В то время в США была создана компьютерная сеть ARPAnet, которая объединяла компьютерные центры министерства обороны и ряда академических организаций. Хотя реальное появление Интернет как объединения шести крупных IP-сетей США в единую научную сеть NSFNET состоялось лишь в 1986 году. Сегодня сеть NSFNET является в этой стране опорной сетью и играет особую роль во всем Интернете, поскольку без регистрации в ней не обходится подключение сетей никакой другой страны. Интернет представляет собой сеть связанных друг с другом компьютерных систем и различных компьютерных служб. Эта сеть является совокупностью различных компонентов, таких, как электронная почта, телеконференции, FTP-узлы, «разговор» (chat) в реальном времени.

Всемирная паутина — World Wide Web (WWW) появилась на свет в 1992 году. Она была создана Тимом Бернерсом — Ли из Европейского центра ядерных исследований (CERN), расположенного в Женеве, Швейцария. К октябрю 1993 года она насчитывала свыше 200 действующих Web-серверов, а к июню 1995 года их общее число составляло свыше 6,5 миллиона. В настоящее время уже существует более 30 миллионов.

Всемирная паутина является наиболее известным и признанным средством доступа к информационным ресурсам Интернета. В действительности она является системой связанных между собой страниц, представляющих Web-узлы всего мира. Эти страницы содержат ссылки, которые имеют вид выделенного текста или рисунков. Просто щелкнув мышью по такой ссылке, вы можете перенестись с данной страницы на другую, и возможно, эта новая страница будет находиться на компьютере с другой стороны земного шара.

Цель данной работы – рассмотреть программное обеспечение для работы с Интернет-ресурсами и электронной почтой, создать веб-сайт.

1 Программные средства для просмотра web-страниц.

Браузер — программное средство для просмотра веб-страниц, комплексное приложение для обработки и вывода разных составляющих веб-страницы, и для предоставления интерфейса между веб-сайтом и его посетителем.

На сегодняшний день существует множество программ для просмотра веб-страниц – это Amaya, Camino, Dillo, ELinks, Epiphany, Galeon, ICab, Internet Explorer, Links, K-Meleon, Konqueror, Mosaic, Mozilla, Opera, Safari, Mozilla Firefox, Netscape и другие. Я более подробно опишу браузер – Internet Explorer.

Windows Internet Explorer, сокращённо IE— серия графических браузеров разрабатываемых корпорацией Microsoft начиная с 1995 года и входящих в состав линейки операционных систем Microsoft Windows. Internet Explorer является наиболее широко используемым web-браузером начиная с 1999 года; достигая пика 95—ой доли использования в течение 2002 и 2003 годов. Internet Explorer 7.0 является актуальной версией браузера, которую можно загрузить с сайта Microsoft с 18 октября 2006 года.

Internet Explorer — это приложение, разработанное для обзора веб-страниц и работы с ними. Данное приложение предоставляет пользователю возможность создания оптимальных условий для работы в сети Internet: настройки безопасности и конфиденциальности подключения, корректирование графического содержания веб-страниц при помощи задания шрифта и его размера, а также возможность ускорения и упрощения работы путём вынесения в панель необходимых кнопок и сохранения нужных ссылок в графе «Избранное», а также при использовании сочетаний клавиш.

Internet Explorer имеет вкладки, блокировщик всплывающих окон, фишинг-фильтр, групповую политику и возможность автообновления через Windows Update.

В Приложении 1 приведен пример рабочего окна Internet Explorer.

2 Программные средства для работы с электронной почтой.

Один из наиважнейших ресурсов Интернета — электронная почта (англ. E-mail либо email, сокр. от electronic mail— способ передачи информации в компьютерных сетях),— позволяющий обмениваться текстовыми сообщениями и произвольными файлами, появился в Интернете еще до возникновения серверов Web.

Сегодня по своей популярности электронная почта лидирует в списке сервисов Интернета. Именно этот способ пересылки сообщений в основном используется для ежедневной деловой и личной переписки, так как электронная почта работает намного быстрее и надежнее, чем обычная почтовая связь.

Основная особенность электронной почты заключается в том, что информация отправляется получателю не напрямую, а через промежуточное звено — электронный почтовый ящик, который представляет собой место на сервере, где сообщение хранится, пока его не запросит получатель. В большинстве случаев для доступа к почтовому ящику требуется наличие пароля. Доступ к почтовому серверу может предоставляться как через почтовые программы, так и через веб-интерфейс.

Электронная почта появилась вместе с операционной системой UNIX. Работать с электронной почтой в локальных и глобальных компьютерных сетях, выполненных на базе UNIX, позволял протокол копирования UNIX-UNIX (UNIX to UNIX Copy, UUCP). При использовании этого протокола почта передавалась последовательно с одного узла на другой, в результате чего она иногда долго путешествовала по сети, прежде чем достигала адресата.

Сегодня в Интернете протокол UUCP, хотя и применяется, но гораздо меньше: его постепенно заменяют современные протоколы — протокол почтового отделения (Post Office Protocol, POP), простой протокол передачи почты (Simple Mail Transfer Protocol, SMTP) и протокол доступа к сообщениям Интернета (Internet Message Access Protocol, IMAP). Они надежнее и быстрее, чем UUCP.

Пошаговое прохождение электронной почты от отправителя получателю:

Соединение почтового клиента с SMTP-сервером отправителя;

Передача SMTP-серверу информации о том, кому предназначается почта и кто является отправителем;

Проверка SMTP-сервером корректности данных об адресате и адресанте и принятие письма (с заголовками и телом письма);

Постановка письма в очередь доставки;

DNS-запрос о почтовых серверах (MX-записи) для домена адресата;

Попытка соединения SMTP-сервера отправителя с почтовыми серверами адресата, имеющими наибольший приоритет. Если попытка неудачна, делаются ещё попытки соединения с резервными почтовыми серверами домена адресата;

Передача письма в случае удачного соединения с почтовым сервером домена адресата, либо постановка в очередь для попытки переслать письмо позже, в случае неудачи;

Прием SMTP-сервером домена адресата письма

Проверка письма на предмет его похожести на спам

Передача его модулю, который занимается хранением писем и выдачей их адресатам по протоколу POP3, IMAP или другим;

Соединение адресата с POP3 или IMAP сервером, аутентификация и получение письма адресатом.

Самыми распространёнными программными средствами для работы с электронной почтой (их еще называют – почтовые клиенты) являются: Microsoft Outlook, Microsoft Outlook Express, The Bat и др. Я остановлюсь на подробном описании почтового клиента – Outlook Express.

Outlook Express почтовая программа разработки Microsoft Corp. Это пожалуй самая распространенная почтовая программа, поскольку входит в комплект всех версий операционной системы MS Windows. Эта программа весьма удобна: она способна работать с электронной почтой и серверами новостей, имеет интуитивно ясный интерфейс пользователя, не вызывает проблем с отображением символов кириллицы, способна передавать не только текст, но и красочно оформленные сообщения в виде документов HTML. Для хранения электронных почтовых адресов предусмотрена специальная записная книжка, которая обладает всеми перечисленными выше функциями.

Outlook Express поставляется в составе операционных систем Windows начиная с Windows 95 ,а также вместе с браузером Internet Explorer начиная с версии 4.0.

Название Outlook Express предполагает, что эта программа является «облегчённой» версией Microsoft Outlook — органайзера от Майкрософт, который также содержит функции работы с электронной почтой. На самом деле между этими двумя программами мало общего. Кроме того, Outlook, в отличие от Outlook Express, не имеет функций для работы с группами новостей.

В приложении 2 приведен пример рабочего окна Microsoft Outlook Express.

3 Разработка Интернет-сайта

3.1 Программные средства для разработки Интернет-страниц

Для того чтобы создать Интернет-сайт, необходимо позаботиться о том, чтобы был необходимый и достаточный набор средств для этого (Windows – версия не позднее 98, MS Office, Microsoft FrontPage, Internet Explorer и многие другие).

Читать еще:  Анализ темпов роста

Веб-страница — гипертекстовый ресурс Интернет, написанный на языке HTML.

HTML — популярный язык гипертекстовой разметки документов, позволяющий создавать интерактивные публикации в Интернете. HTML-страница это текст, имеющий расширение html, или htm, который может быть написан в любом текстовом редакторе. Кроме собственно текста он включает команды для браузера.

Несколько веб-страниц, объединенных общей темой и дизайном, а также связанных между собой ссылками, образуют веб-сайт.

Разработка Интернет-страниц возможна при помощи различных приложений, например такие как FrontPage, DreamWeaver.

Мною был разработан сайт компании «PONY EXPRESS», с помощью пакета приложений MS Office.

3.2 Цели и задачи сайта

В данной курсовой работе был разработан интернет-сайт, деятельность которого связана с экспресс-доставками почты на территорию России и СНГ. Бизнес-модель этого сайта В2С, одна из самых распространенных моделей в on-line бизнесе. Целью сайта является оказание услуг.

Составляющими В2С компании являются:

интерактивный веб-сайт об услугах; Сайт предоставляет возможность оформить on-line заказы и отслеживать их исполнение. По аналогии с on-line бизнесом веб-сайт представляет фронт-офис;

площадка хостинга сайта расположена на сервере фирмы;

Диспетчерская служба и служба поддержки клиента;

Back-office: технический персонал и администрация;

Подразделения по работе с поставщиками;

Система расчетов за услуги;

3.3 Структура, содержание, особенности сайта

Сайт компании «PONY EXPRESS» содержит главную страницу и пять вспомогательных.

Разработанный сайт содержит следующие страницы:

Главная страница – описаны преимущества компании;

2 – Историю создания «PONY EXPRESS» в России;

3 – Услуги, которые предоставляет компания;

4 – Начало работы в России, численность персонала;

5 – Вакансии, предоставляемые компанией, в связи с открытием нового отдела;

6 – Тарифы на доставку по России и СНГ из городов, где есть представители PONY EXPRESS.

4 Средства поиска информации в Интернет.

Сравнительная характеристика поисковых сайтов

Найти необходимую информацию в Интернете нам помогают поисковые сайты (поисковые машины).

Цель поисковой машины – предоставить содержание высокого качества людям, ищущим что-то в Интернете. Существует множество сайтов, например, такие как: Google, Yahoo, Rambler, Yandex и другие.

Несмотря на различные подходы к организации Интернет-контента, у всех поисковых систем есть схожие базовые составляющие:

— Индекс (или Каталог)

Паук полностью соответствует своему названию. Он рыщет по Интернету, следуя ссылкам, обновляет страницы и добавляет новые страницы, когда находит их.

Индекс- это место для хранения данных, собранных Пауком.

Поисковый алгоритм и поисковый интерфейс используются для определения наиболее подходящего документа. На первом этапе, поисковая машина пытается определить стремления пользователя, посредством анализа терминов, использованных при поиске.

Некоторые поисковые машины, такие, как Google и Yahoo! Обладают системами типа Google Search History и My Yahoo!, которые собирают информацию о пользователях. Поисковые машины могут учитывать недавние запросы или схожее поведение пользователей, с тем, чтобы определить общую концепцию поиска и наибольшую релевантность документов.

При поиске в Интернет важны две составляющие — полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом — релевантность, то есть соответствие ответа вопросу, поэтому мною была проведена сравнительная характеристика поисковых сайтов: Rambler (приложение 3) и Yandex (приложение 4). Мне необходимо было сравнить количество найденного и определить какой из них является релевантным.

Был введен один и тот же запрос «Задачи и функции службы управления персоналом». В результате чего были получены следующие результаты:

Rambler – найдено 3596 документов, из них 15 соответствуют теме запроса;

Yandex – найдено 5725 документов, из них 65 соответствуют теме запроса.

Сравнив эти данные, были построены диаграммы, отражающие полученные результаты (рисунок 1). В таблице 1 показано количество всех найденных документов, и те которые соответствуют запросу.

Тема 3. Мировые информационные сети

3.1. Структура представления информации в мировых информационных сетях

Цель:

  • ознакомиться со структурой представления информации в мировых информационных сетях;
  • получить представление о принципах работы поисковых систем о правилах поиска информационных ресурсов о семантических оценках качества поиска;
  • научиться искать информацию с помощью тематических каталогов;
  • освоить технологию поиска в поисковых системах;
  • узнать о способах составления тезауруса;
  • ознакомиться с информационными ресурсами, представляемыми агрегатором информационных источников EBSCO Publishing.

Оглавление

Характеристика Интернет

Интернет – это сеть сетей – соглашение между множеством компьютерных сетей во всем мире, касающееся того, как эти сети должны взаимодействовать между собой (рис.1).

24 октября 1995 года Федеральный сетевой совет (FNC) одобрил резолюцию, определяющую термин «Интернет».

Интернет – это глобальная информационная система, которая:

  • логически взаимосвязана пространством глобальных уникальных адресов, основанных на Интернет-протоколе (IP) или на последующих расширениях или преемниках IP;
  • способна поддерживать коммуникации с использованием семейства протокола управления передачей/Интернет-протокола (TCP/IP) или его последующих расширений/преемников и/или других IP-совместимых протоколов;
  • обеспечивает, использует или делает доступными на общественной или частной основе высокоуровневые услуги, надстроенные над описанной здесь коммуникационной и иной связанной с ней инфраструктурой.

Инфраструктура Интернет (Рис.2):

  • Магистральный уровень (система связанных высокоскоростных телекоммуникационных серверов).
  • Уровень сетей и точек доступа (крупные телекоммуникационные сети), подключенных к магистрали.
  • Уровень региональных и других сетей.
  • ISP – интернет-провайдеры.
  • Пользователи.

Виды компьютерных сетей:

  • локальные;
  • региональные;
  • корпоративные;
  • глобальные сети.

Основные службы и сервисы Интернет:

  • Удаленный доступ (Telnet).
  • Электронная почта (E- Mail).
  • Телеконференции (Usenet).
  • Протокол передачи файлов (FTP).
  • «Всемирная паутина» World Wide Web.

Гипертекст – система связанных документов на серверах WWW, содержащих ссылки на другие, связанные по смыслу документы.

Будучи связаны друг с другом посредством ссылок, все существующее множество документов Web рождает аналогию компьютерной паутины, окутавшей планету.

Адресация в Интернет:

  • IP-адрес, состоящий из 4 байт (рис.3), например: 116.37.10.30. Этот адрес используется на сетевом уровне. Он назначается администратором во время конфигурирования компьютеров и маршрутизаторов.
  • Символьный идентификатор-имя (DNS) – доменные адреса, например: dvinaland.ru

IP v 4 – адрес является уникальным 32-битным идентификатором IP-интерфейса в Интернет.

IP v 6 – адрес является уникальным 128-битным идентификатором IP-интерфейса в Интернет, иногда называют Internet -2, адресного пространства IP v 4 уже стало не хватать, поэтому постепенно вводят новый стандарт.

IP-адреса принято записывать разбивкой всего адреса по октетам (8), каждый октет записывается в виде десятичного числа, числа разделяются точками. Например, адрес

10100000010100010000010110000011
записывается как

При этом: 160.81.5.131 — IP-адрес

160.81.5. — номер сети

131 — номер хоста

domain 3. domain 2. domain 1

domain 1 — код страны или тематический код

domain 2 — наименование организации

domain 3 — имя сервера или компьютера организации

Например: ibi. spb. ru

Адресация документов на WWW — сервере

URL – универсальный указатель ресурса:

http – протокол передачи данных

www – вид сервиса Интернет

gpntb. ru – адрес сервера ГПНТБ

inter – events / crimea 2000 – место размещения документа на сервере и название документа

  • язык гипертекстовой разметки документов HTML;
  • протокол обмена гипертекстовой информации HTTP;
  • уникальный способ адресации ресурсов в Интернет- URL.

Принципы работы поисковых систем

Поисковые системы включают следующие программные компоненты:

  • spider (паук): браузероподобная программа, которая скачивает веб-страницы;
  • crawler «путешествующий» паук, который автоматически идет по всем ссылкам, найденным на странице;
  • indexer (индексатор): «слепая» программа, которая анализирует веб-страницы, скаченные пауками;
  • the database (база данных): хранилище скаченных и обработанных страниц;
  • search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

Spider: Паук – это программа, которая скачивает веб-страницы.

Он работает как броузер, когды вы соединяетесь с веб-сайтом и загружаете страницу.

Паук не имеет никаких визуальных компонент.

То же действие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете «просмотр HTML-кода» в своем браузере.

Crawler: Как и паук, скачивает страницы, он анализирует страницу и находит все ссылки.

Его задача – определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов.

Indexer: Индексатор разбирает страницу на различные ее части и анализирует их.

Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов стилевых частей страницы вычленяются и анализируются.

Database: База данных – это хранилище всех данных, которые поисковая система скачивает и анализирует.

Search Engine Results Engine – система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя.

Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск.

Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании постоянно меняющихся критериев.

Алгоритмом называется метод, по которому поисковая система принимает решение.

Профессиональные оптимизаторы иногда употребляют термин «algos».

Поисковые системы отбирают результаты поиска на основании следующих критериев:

  • Title (заголовок): Присутствует ли ключевое слово в заголовке?
  • Domain/URL (Домен/адрес): Присутствует ли ключевое слово в имени домена или в адресе страницы?
  • Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или текстовых заголовках?
  • Density (плотность): Как часто ключевое слово употреблено на странице? Количество ключевых слов относительно текста страницы называется плотностью ключевого слова.
  • MetaInformation (мета данные): – мета ключевые слова (meta keywords) и мета описания (meta description).
  • Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?
  • Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный сайт? Каков текст ссылки? Это называется «внестраничный» критерий, потому что автор страницы не всегда может им управлять.
  • Insite Links (ссылки внутри страницы): На какие еще страницы данного сайта содержит ссылки эта страница?
Читать еще:  Виды информационных систем экономического анализа

Т.о., поисковой системе необходимо делать множество уточняющих запросов, используя страницу целиком.

Результаты поиска оцениваются на основе семантических оценок качества, таких как: информационный шум, полнота выдачи документов, точность выдачи, потеря информации.

Правила поиска информационных ресурсов в мировых информационных сетях

Основные методы поиска информации в Интернете:

  • Непосредственный поиск с использованием гипертекстовых ссылок — часто оказывается единственно возможным на заключительных этапах информационного поиска.
  • Использование поисковых машин — основной метод при проведении предварительного поиска (Yandex, Rambler, Aport, Google, и т.п.).
  • Поиск с применением специальных средств (спайдеров ) — полностью автоматизированный метод — может оказаться весьма эффективным для проведения первичного поиска.
  • Анализ новых ресурсов — может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике.
  • Технология проведения информационного поиска.
  • Определение географических регионов поиска, т.к. практическая ценность информационного ресурса может зависеть и от географического расположения соответствующего источника.
  • Составление тезауруса.

Для эффективного использования поисковых серверов необходим список ключевых слов, организованный с учетом семантических отношений между ними, т. е. тезаурус.

При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.

  • Отбор поисковых машин. Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины.
  • Составление и выполнение запросов к поисковым машинам.

Это наиболее сложный и трудоемкий этап, связанный с обработкой большого количества информации (в основном шумовой).

На основе тезауруса формируются запросы к выбранным поисковым серверам, после чего возможно уточнение запроса с целью отсечения очевидно нерелевантной информации.

Затем производится отбор ресурсов, начиная с наиболее интересных, с точки зрения целей поиска.

Данные с ресурсов, признанных релевантными, собираются для последующего анализа.

Анализ информационных ресурсов сети интернет

Реализовав в 1990 году первый в мире веб-браузер WorldWideWeb [1], Tim Berners-Lee заложил основной принцип организации гипертекстовых документов посредством коммуникационного взаимодействия пользователя с информационной системой через сеть Интернет. Такие достоинства, как структуризация информации, простота и привычность интерфейса, возможность удаленной работы и быстрота разработки веб-приложения, позволили веб-обозревателю стать одним из обязательных самостоятельных приложений в составе большинства операционных систем, а интернет-ресурсам – одним из стратегически важных и динамически развивающихся видов информационных ресурсов. Современный информационный ресурс сегодня представляет собой не просто статичный набор веб-страниц, а многофункциональный портал с использованием различных средств и технологий, в том числе и применением различных шаблонов для разных уровней вложенности.

Вместе с этим неотъемлемой частью полноценного безопасного функционирования информационного ресурса является его корректность. Это выражено не только тем, что «браузерный движок» веб-обозревателя для преобразования содержимого веб-страниц в интерактивное отображение использует собственную трактовку интернет-спецификаций, но и возможностью присутствия на информационном ресурсе функционально-некорректных конструкций. Таким образом, простая проверка того, что интернет-ресурс приемлемо функционирует в нескольких веб-браузерах, только показывает удовлетворяемое качество разработанного кода на текущий момент времени и не дает абсолютно никакой гарантии его правильного отображения в следующий раз. Существование такой проблемы также подтверждают внесенные в 2014 году при разработке спецификации HTML5 консорциумом W3C предложения по анализу структуры HTML-документа [9, п.п. 8.2.8].

Отчасти, это связано как с постепенно возрастающей сложностью веб-приложения, которая не позволяет разработчикам информационного ресурса своевременно контролировать качество написанного кода, так и отсутствием разработанных методов и программных инструментов для проведения такого комплексного анализа. Разработанный консорциумом W3C Validator Suite [12] позволяет проводить анализ корректности исходного кода информационного ресурса только по стандартам HTML и CSS [9, 10], что не позволяет полностью охватить все используемые технологии информационного ресурса. Более того, данное программное средство производит слишком строгий анализ на соответствие исследуемым стандартам. Другие веб-анализаторы, такие как Rational AppScan (IBM), Web Vulnerability Scanner (Acunetix), NTOSpider (NT Objectives, Inc.), NetSparker (Netsparker Ltd.), WebInspect (HP), Application Inspector (PT), SkipFish (Google) и др. направлены, в первую очередь, на получение оценки защищенности информационного ресурса.

Тем самым на текущий момент не предоставляется возможным своевременно отлавливать критические ошибки информационного ресурса. Это значит, что невозможно получить его достоверную оценку корректности функционирования и провести комплекс мероприятий, направленных на повышение общей безопасности интернет-ресурса. Корректность функционирования таких источников информации необходима и важна не только государственным, но и коммерческим организациям, чья деятельность подразумевает гарантированное предоставление услуг и информации в сети Интернет. Именно такие задачи при эксплуатации государственных информационных ресурсов общего пользования определены законодательными и нормативно-методическими документами Российской Федерации [3–6]. Это обуславливает необходимость проведения периодического мониторинга качества кода информационного ресурса при его создании (разработке) и эксплуатации. Поэтому задача исследования состоит как в разработке эффективной проверки функционирования исходного кода интернет-страниц информационного ресурса, так и в легкости применения разработанных средств. Разрабатываемый алгоритм требуемого программного обеспечения должен:

– иметь гибкую структуру для его модификации и расширения возможностей;

– использовать параллельные технологии для проведения эффективного анализа;

– проводить анализ доступности всех компонентов интернет-ресурса;

– учитывать основные составляющие технологии информационного ресурса;

– исследовать не только функционально-корректные конструкции, но и допустимость задания в них значений атрибутов, селекторов и т.д.;

– учитывать современные тенденции к формированию исходного кода интернет-страниц информационного ресурса с учетом использования системы управления содержимым (CMS).

В соответствии со сформированными условиями, алгоритм логично разделить на две составляющие:

– алгоритм анализа всех составляющих частей информационного ресурса (основной алгоритм проведения анализа);

– алгоритм анализа веб-страниц информационного ресурса (алгоритм работы веб-анализатора).

Главный цикл процесса анализа состоит из трех ключевых этапов: загрузка, анализ содержимого и анализ найденных интернет-ссылок для продолжения исследований [9]. Такое ключевое разделение с применением параллельных технологий на пользовательском уровне позволяет более эффективно использовать возможности не только процессорной системы, но и существующего канала связи, что дает перспективы для проведения более быстрого анализа больших информационных ресурсов за обозримое время.

Содержимое интернет-страницы в общем случае представляет собой совокупность нескольких веб-технологий. Основной технологией такого документа является HTML. Выпущенный в 2014 году стандарт HTML5, как приложение стандартного обобщённого языка разметки SGML, содержит только принципы для построения синтаксической схемы [9, п.п. 8.1]. Основными вспомогательными технологиями HTML-документа являются CSS и JavaScript. Стандарт HTML5 устанавливает взаимно-однозначное использование между данными технологиями.

Язык стиля CSS определен принятой в 2011 году спецификацией CSS2.1, в которой содержатся правила построения селекторов и свойств [4, п. 4, п. 10, Приложение G]. Разрабатываемая спецификация CSS3 и CSS4 существенно расширяет функциональность текущего стандарта, однако до сих пор (с 29 сентября 2011 года) не является рекомендованной консорциумом W3C.

Язык JavaScript является расширением языка ECMAScript 5.1 [10]. Учитывая тот факт, что каждый из веб-обозревателей является независимой разработкой, данный стандарт рассматривается как основа для построения скриптовых языков. Таким образом, основными составляющими языка JavaScript являются [11]:

– «клиентский» JavaScript (интерпретатор JavaScript, встраиваемый в веб-браузер);

– «базовый» JavaScript (язык JavaScript, определяемый спецификациями);

– Document Object Model (спецификация W3C DOM [12]).

И хотя спецификация ECMAScript 5.1 содержит синтаксические схемы [13, Приложение А], проведенное Крокфордом Д. исследование позволило сформировать используемые веб-обозревателями синтаксические схемы языка JavaScript [2], где основными функционально значимыми конструкциями являются «Объявление переменных», «Литерал функции», «Операторы» и «Пробел».

В результате проведенных выше заданных требований синтаксическая схема для проведения анализа интернет-страницы может быть сформирована следующим образом (рисунок).

Синтаксическая схема разбора интернет-страницы информационного ресурса

Таким образом, разработанная схема позволяет проводить анализ интернет-страниц информационного ресурса, выявляя функционально-некорректные структуры, нарушающие его полноценное безопасное функционирование.

Рецензенты:

Станкевич Г.А., д.э.н., профессор, ведущий научный сотрудник South IT-Uni, IBC, г. Москва;

Бихтер И.И., д.т.н., профессор, старший научный сотрудник сектора инновационных разработок АНОО ДПФО «Национальный центр прикладных исследований», г. Саратов.

Ссылка на основную публикацию
Adblock
detector