Como funciona a internet

A Internet é o conjunto de vários computadores e dispositivos conectados em uma rede mundial. Sua criação remonta da época da Guerra Fria (década de 1960), quando Estados Unidos e União Soviética disputavam a supremacia do mundo e necessitavam de meios eficazes de telecomunicação. Atualmente, 2 bilhões de pessoas acessam a internet, exercendo influência em diferentes áreas da economia e sociedade, promovendo disseminação da informação de maneira rápida e global.

Mapa 3D ilustrando o tráfego de informações na internet (cores quentes indicam maiores fluxos). Fonte: http://OAFRICA.www.oafrica.com/statistics/vintage-internet-maps-1991-2003/

Mapa 3D ilustrando o tráfego de informações na internet (cores quentes indicam maiores fluxos). Fonte: OAFRICA.

Uma rede de computadores é formada por um conjunto de módulos processadores (computadores, impressoras, celulares, câmeras, etc) capazes de trocar informações e partilhar recursos. Os dispositivos interligados pelo protocolo de comunicação TCP/IP que permite o acesso a informações e todo tipo de transferência de dados. Ela carrega uma ampla variedade de recursos e serviços, incluindo os documentos interligados por meio de hiperlinks da World Wide Web (Rede de Alcance Mundial), e a infraestrutura para suportar correio eletrônico e serviços como comunicação instantânea e compartilhamento de arquivos.

Protocolo de comunicação TCP/IP

Um protocolo é uma convenção que controla e possibilita uma conexão, comunicação, transferência de dados entre dois sistemas computacionais. Comparando-se com a comunicação entre pessoas, um protocolo pode ser definido como “as regras que governam” a sintaxe, semântica e sincronização da comunicação. O TCP/IP é um conjunto de protocolos de comunicação entre computadores em rede, onde TCP significa Transmission Control Protocol (Protocolo de Controle de Transmissão) e IP significa Internet Protocol (Protocolo de Internet).

O conjunto de protocolos pode ser visto como um modelo de camadas (Modelo OSI), onde cada camada é responsável por um grupo de tarefas, fornecendo um conjunto de serviços bem definidos para o protocolo da camada superior. As camadas mais altas estão logicamente mais perto do usuário (chamada camada de aplicação) e lidam com dados mais abstratos, confiando em protocolos de camadas mais baixas para tarefas de menor nível de abstração.

Modelo de camadas para descrever o protocolo TCP/IP.

Modelo de camadas para descrever o protocolo TCP/IP.

  1. Camada Física: define especificações elétricas e físicas dos dispositivos; transmissão e recepção do fluxo de bits brutos. Ex: modem, USB, bluetooth.
  2. Enlace ou Ligação de dados: detecta e, opcionalmente, corrige erros que possam acontecer no nível físico; controlar o fluxo (recepção, delimitação e transmissão de quadros). Ex: Ethernet, 802.11 WiFi.
  3. Camada de Rede: roteadores operam nesta camada, enviando dados em toda a rede estendida através de endereçamento lógico. Ex: IP.
  4. Camada de Transporte: controle de fluxo, ordenação dos pacotes e a correção de erros, tipicamente enviando para o transmissor uma informação de recebimento; recebe os dados enviados pela camada de sessão e segmentá-los para que sejam enviados a camada de rede, que por sua vez, transforma esses segmentos em pacotes (e vice-versa para o envio). Ex: TCP, UDP.
  5. Camada de Sessão: estabelece e encerra os laços de comunicação.
  6. Camada de Apresentação: converte o formato do dado recebido pela camada de Aplicação em um formato comum a ser usado na transmissão desse dado (e vice-versa para o recebimento). Ex: conversão do padrão de caracteres (código de página) quando o dispositivo transmissor usa um padrão diferente do ASCII, compressão de dados, criptografia.
  7. Camada de Aplicação: programas utilizados para promover uma interação entre a máquina-usuário. Ex: HTTP, SMTP, FTP, SSH, Telnet, POP3, IMAP, BitTorrent, DNS, Ping.

Para ficar mais claro o fluxo de dados pelo computador e pela internet, assista esse vídeo ilustrando os pacotes de informação como carros em estradas e os elementos direcionadores do fluxo (produzido pelos “Warriors of the net“):

Endereço IP

Um endereço IP é um número usado para identificar uma interface de rede num computador em uma rede local ou na internet. Na sua versão mais utilizada atualmente (IPv4), este número é codificado em 32 bits, e é normalmente representado como 4 números separados por pontos (e.g. 192.168.0.1), cada número entre 0 e 255 (inclusive, o que corresponde a 8 bits de dados). A próxima versão do protocolo, IPv6, extende este espaço de endereçamento para 128 bits, e os endereços são geralmente representados como séries de números hexadecimais separados por dois-pontos (e.g., 2001:0db8:13bb:0002:0000:0000:0000:0020, ou 2001:db8:13bb:2::20 resumidamente).

Uma máscara de subrede (máscara de rede) define no seu código binário que porções de um endereço IP correspondem à rede, e o restante especifica a máquina. No exemplo de configurar um endereço IPv4 estático dado aqui, a máscara de subrede, 255.255.255.0 (24 “1”s seguidos de 8 “0”s na representação binária) indica que os primeiros 24 bits do endereço IP correspondem ao endereço de rede, e os outros 8 são específicos da máquina. Em IPv6, por legibilidade, apenas os números “1”s são mostrados; a máscara de rede para uma rede IPv6 poderia ser 64, aumentando o número de possibilidades.

  • 24 seria máscara 255.255.255.0 (rede classe C)
  • 16 seria máscara 255.255.0.0 (rede classe B)
  • 8 seria máscara 255.0.0.0 (rede classe A)

O endereço de rede é um endereço IP no qual a parte descrevendo o número da máquina é 0. O intervalo de endereços IPv4 em uma rede é às vezes indicado pela sintaxe, a.b.c.d/x, onde a.b.c.d é o endereço de rede e x é o número de bits afetados pela parte da rede no endereço IP. A rede de exemplo pode então ser escrita: 192.168.0.0/24. A sintaxe é similar no IPv6: 2001:db8:13bb:2::/64.

Veja abaixo o seu IP na internet e observe que é possível obter informações de localização:

Um roteador é uma máquina que conecta várias redes umas às outras. Todo o tráfego que passa por um roteador é direcionado para a rede correta. Para fazer isto, o roteador analisa pacotes entrando e os redireciona de acordo com o endereço IP de destino. O roteador é às vezes conhecido como um gateway; nesta configuração, ele funciona como uma máquina que ajuda a alcançar mais do que a rede local (indo por uma rede estendida, como a Internet).

O endereço especial de broadcast conecta todas as estações numa rede. Quase nunca é “roteado”, ele apenas funciona na rede em questão. Especificamente, significa que um pacote de dados endereçado para o broadcast nunca atravessa o roteador.

DNS (Domain Name System – Sistema de Nomes de Domínios) é um mapeamento de serviço distribuída e hierárquica de nomes e endereços IP, transformando um nome amigável como www.debian.org no endereço IP real, 5.153.231.4 ou 2001:41c8:1000:21::21:4. O registros do DNS são organizados em zonas; cada zona coincide com um domínio (ou um subdomínio) ou um intervalo de endereço IP (já que endereços IP são geralmente alocados em intervalos consecutivos). Um servidor primário tem autoridade sobre o conteúdo de uma zona; servidores secundários, geralmente hospedados em máquinas separadas, fornecem regularmente cópias atualizadas da zona primária – por isso quando um novo IP é cadastrado, demoram algumas horas para “propagar” a mudança pela internet e os servidores DNS.

DHCP (Dynamic Host Configuration Protocol) é um protocolo pelo qual uma máquina pode receber automaticamente sua configuração de rede no momento de inicialização. Isso permite centralizar o gerenciamento de configuração de uma rede, e garante que todas as máquinas recebam configurações similares. Ou seja, é necessário configurar um servidor DHCP para a rede em questão.

Um serviço muito utilizado na internet é o servidor web (HTTP), sendo seu principal programa o Apache (no Linux). Outro serviço que necessita de um servidor é o envio e recebimento de e-mails (correio eletrônico). No Linux Debian, o pacote postfix inclui um o daemon SMTP principal.

Porta é um ponto físico ou lógico no qual podem ser feitas conexões, ou seja, um canal através do qual os dados são transferidos entre um dispositivo de entrada e o processador ou entre o processador e um dispositivo de saída. A semelhança física é com os portos náuticos onde os mesmo atracam e permitem a transferência de mercadorias e pessoas. Veja uma lista de portas de protocolos utilizados.

World Wide Web

A Organização Europeia para a Investigação Nuclear (CERN) foi a responsável pela invenção da World Wide Web (www), ou simplesmente a Web, como hoje a conhecemos. Páginas da internet são conjuntos de arquivos localizados em computadores conectados na rede, conhecidos como servidores. O usuário (chamado de cliente) faz uma requisição de acesso aos dados desse computador e também os recebe através de protocolos, conforme visto anteriormente.

O Servidor web é um programa de computador responsável por aceitar pedidos HTTP de clientes, geralmente os navegadores (ou browser, como o Firefoz, Internet explorer e Chrome), e servi-los com respostas HTTP, incluindo opcionalmente dados, que geralmente são páginas web, tais como documentos HTML com objetos embutidos (imagens, etc.). O mais popular, e mais utilizado no mundo, é o servidor Apache.

O hiperlink (ou simplesmente link) é uma referência dentro de um documento em hipertexto a outras partes desse documento ou a outro documento, acessível ao clicar com o mouse nele (por exemplo). Por sua vez, hipertexto é um texto em formato digital, ao qual se agregam outros conjuntos de informação na forma de blocos de textos, palavras, imagens ou sons, cujo acesso se dá através de referências específicas denominadas hiperlinks (ou atalhos).

Para entender melhor como uma página de internet é formada, veja essa apresentação:

Arquivo da web

O arquivamento da internet é o processo de coleta e preservação de páginas da internet em um servidor para futuros pesquisadores, historiadores e ao público interessado em visualizar versões de páginas antigas ou não mais existentes. Devido à volatilidade da Web, a maioria da informação deixa de estar disponível passado pouco tempo -após um ano, apenas 20% dos endereços se mantém válidos. Devido ao grande volume de informações, os arquivistas normalmente empregam “web crawlers” (programas para realizar o processo automaticamente). A maior organização de arquivamento da internet com base em abordagem de rastreamento é a Internet Archive, que dispõe um site da Wayback Machine para qualquer usuário realizar uma busca. É uma ferramenta interessante para os nostálgicos da web ou para procurar um texto cujo link não funciona mais e foi abandonado. Outra “Wayback Machine” é o Archive.Today.

Para saber mais sobre a internet, clique nesse hiperlink para acessar o conteúdo da Wikipedia sobre internet.

Compartilhe o link desse texto, mas se for copiar algum trecho, cite a fonte. Valorize nosso trabalho.
Mais informações na licença de uso do site.

3 Pingbacks/Trackbacks