Es común, incluso puede ser habitual, que necesitemos crear una conexión entre dos programas o dispositivos al programar; pues bien, los sockets en Python y otros lenguajes, están pensados para eso.
Los sockets son una estructura que permite la conexión entre dos aplicaciones, procesos o equipos, (IPC) estableciendo una relación cliente/servidor, que permite el intercambio de datos, incluso entre programas colocados en ordenadores diferentes.
Los sockets, pueden interpretarse como el punto final de una conexión, donde para establecerla será necesario como mínimo:
- definir la dirección IP local y remota de los ordenadores que participan,
- el puerto de conexión
- y el protocolo de transporte de la información.
La comunicación que se crea tendrá por tanto un carácter bidireccional.
La relación cliente/servidor, también significa que el comportamiento de los socket no es el mismo, en ambos casos, mientras en el cliente es el punto final de una conexión, en el servidor se comporta como una centralita telefónica, que usa sockets clientes y servidor
La fácil manipulación que ofrecen los sockets, los hace prácticamente imprescindibles, si la conexión es multiplataforma, aunque también son ampliamente usados en cualquier tipo de comunicación IPC (Inter-Process Communication), sin que sean los únicos, que existen.
Los tipos de sockets en Python:
Pueden ser de flujo (sock Stream), que emplean el protocolo de transmisión TCP, o de datagrama (Sock_Dgram), que emplean UDP, para transmitir los datos.
El protocolo TCP (Transmission Control Protocol), difiere en muchos elementos de UDP( User Datagram Protocol), sin embargo la forma más simplificada de explicar su diferencia, seria decir que los mensajes enviados por TCP llegan a su destino en el mismo orden en que se enviaron y los que se envían por UDP, pueden llegar en un orden diferente a como fueron enviado originalmente, además de que en el segundo no hay una forma de verificar la entrega y que es TCP, quien incorpora el concepto de puerto.
En Python, para expresar los datos de conexión para la familia de direcciones AF_INET, se emplea una lista con dos parámetros (host, puerto).
Donde host es una cadena que representa un nombre de host en notación de dominio de Internet como ‘darling.com ‘ o una dirección IPv4 como ‘100.50.200.50’, y el puerto es un entero.
Crear un socket en Python
Los sockets bajo el método TCP, son una forma común de comunicación en internet, por ejemplo, al interactuar con un navegador.
Cuando se da click sobre una dirección en el buscador, es como si escribiéramos lo siguiente en un socket cliente:
sck = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sck.connect(("www.mi_pagina", 80))
En este código primero creamos un objeto socket, que es del tipo cliente, al cual pasamos dos argumentos: el tipo de familia de direcciones (AF_INET), y el tipo de socket (sock-stream).
Clarificando un poco esto, aclaro que existen muchas familias de direcciones (F_UNIX, AF_INET6, AF_NETLINK, AF_TIPC, AF_CAN, AF_BLUETOOTH, AF_PACKET, AF_RDS), siendo AF_INET, la más común.
AF significa Address Family. AF_INET que bien pudo llamarse AF_INET4, se refiere a la familia de direcciones del tipo Protocolo de Internet v4 (IPv4), que emplean 32 bits, mientras AF_INET6 se refiere a familia de direccionamiento de IPv6, que utiliza 128 bits.
Volviendo al código, si bien este sería el script en el socket cliente; en el socket servidor ocurre algo más:
serversocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
serversocket.bind((socket.gethostname(), 2222))
serversocket.listen(4)
O sea, creamos un objeto con las mismas propiedades del cliente, sin embargo empleamos bin()
, para vincularlo a un hostname y un puerto; y finalmente ponerlo a escuchar.
Viendo el detalle; en el primer parámetro de bin()
, estamos indicando a que dirección se conectará.
Usamos gethostname()
en este caso, para que tome un host visible en la red, fuera de nuestro ordenador, pero podríamos emplear localhost, o 127.0.01, para que se visible solo en nuestra máquina.
Los puertos de socket, el segundo parámetro de bin()
, suelen ser puertos con valores de 4 dígitos.
listen()
, le indica a la librería del socket la cantidad de solicitudes máximas de conexión que deseamos poner en cola. Hemos escogido 4, que un número aceptable.
Aunque de forma general, esto es lo que ocurre al establecerse una comunicación entre sockets, que será mejor mostrarlo en un ejemplo más amplio, donde abarquemos todos los momentos.
En este ejemplo emplearemos sys()
, para atrapar los errores desde el intérprete, que se produzcan en la salida en la salida del código.
SOCKET SERVIDOR
#importamos las librerias
import socket
import sys
# creamos el objeto socket
objetoSocket_server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
#introducimos en una variable los datos del servidor
datos_servidor = ('localhost', 10000)
# empleamos sys.stderr para imprimir
print >>sys.stderr, 'empezando a levantar %s puerto %s' % datos_servidor
# asociamos el socket con la dirección del servidor, empleando bind()
objetoSocket_server.bind(datos_servidor)
# para que nuestro socket sea capaz de aceptar la conexión entrante desde el cliente
# y pueda escuchar el mensaje utilizaremos dos métodos: el método accept()
# que nos devuelve una conexión abierta entre el servidor y el cliente,
# por la cual los datos, se leen y transmiten mediante recv() y sendall()
# respectivamente y el metodo listen(), que nos indica las cantidad maxima de
# conexiones aceptadas
objetoSocket_server.listen(1)
while True:
print >>sys.stderr, 'Esperando para realizar conexión'
connection, datos_cliente = objetoSocket_server.accept()
# manejamos la conexion
try:
print >>sys.stderr, 'conectando desde', datos_cliente
while True:
data = connection.recv(19)
print >>sys.stderr, 'recibido "%s"' % data
if data:
print >>sys.stderr, 'devolviendo mensaje al cliente'
connection.sendall(data)
else:
print >>sys.stderr, 'no hay mas datos', datos_cliente
break
finally:
connection.close()
SOCKET CLIENTE
# importamos las librerias
import socket
import sys
#creamos el objeto socket
objetoSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM
# creamos una variable con los datos del servidor.
datos_servidor = ('localhost', 10000)
# empleamos sys.stderr para imprimir
print >>sys.stderr, 'conectando a %s puerto %s' % datos_servidor
#conectamos
objetoSocket.connect(datos_servidor)
try:
mensaje = 'Mensaje de prueba'
print >>sys.stderr, 'enviando "%s"' % mensaje
'''
empleamos sendall()para enviar la información y recv(), para recibirla,
los parámetros del método sendall son los datos que se van a enviar, y el
parámetro de la funcion recv()m es el número máximo de bytes a aceptar.
'''
objetoSocket.sendall(mensaje) # enviando el mensaje
cantidad_recibida = 0
cantidad_esperada = len(mensaje) # recibiendo la respuesta
while cantidad_recibida < cantidad_esperada: data = objetoSocket.recv(19) cantidad_recibida += len(data) print >>sys.stderr, 'recibiendo "%s"' % data
# cerramos el socket al concluir con el método close().
finally:
print >>sys.stderr, 'cerrando socket'
objetoSocket.close()
Como un último punto en este ejemplo, es bueno añadir que el socket cliente es normalmente usado, solo para un intercambio (o un pequeño número de comunicación secuencial), de modo que una vez terminado connect()
es destruido
En esencia, esta es la estructura de una conexión IPC, empleando sockets.
El concepto de los sockets en Python
Resumiendo lo visto hasta aquí, la comunicación del tipo IPC, se ejecuta mejor empleando sockets, los cuales funcionan bajo la estructura cliente servidor.
El socket cliente tiene como función básica conectarse y solicitar o envíar información, mientras la labor del socket servidor es crear sockets clientes y escuchar el puerto.
Dicho de otro modo: una vez creado el socket servidor, este crea un par de sockets clientes, desde los que escucha la información.
La función del socket servidor , no es mandar ningún dato o recibirlo ; sino que produce sockets clientes y cada uno de estos es creado en respuesta a algún otro socket cliente que hace connect()
al host y al puerto al que el socket servidor está vinculado.
Tan pronto como el servidor crea ese socket cliente, vuelve a escuchar por más conexiones.
Los dos sockets clientes, pueden conversar entre ellos, usando un puerto asignado dinámicamente y que será reciclado cuando la conversación termine.
Más sobre los sockets en Python
Existen alternativas para manipular la conexión de manera mas efectiva; ya que una vez creada la conexión, el bucle que empleamos anteriormente, puede funcionar de diferentes modos:
- Crear un hilo para manejar clientsocket,
- crear un proceso nuevo para manejar clientsocket
- Reestructurar el codigo para usar sockets no bloqueantes y usar select para multiplexar entre el «socket servidor» y cualquier clientsocket activo.
IPC
Para ejecutar conexiones IPC rápidas entre dos procesos en una misma máquina, lo aconsejable es revisar la memoria compartida o las tuberías (PIPES).
Cuando se usan sockets con el tipo de redirección AF_INET, es una opción aconsejable vincular el servidor con «localhost», ya que provee un atajo alrededor de algunas capas del código de red, que funciona en casi todas las plataformas.
Los verbos send y recv
Los verbos send
y recv
operan en los buffers de red y están enfocados a manejarlos; y debido a ello, no están obligados a manejar obligatoriamente, todos los bytes que se les entrega, o se espera qué entreguen.
Esto crea la necesidad de llamarlos nuevamente hasta que el mensaje haya sido tratado por completo.
Como devuelven resultados cuando el buffer se llenado (send) o vaciado(recv); cuando recv() retorna 0 bytes es porque al otro lado se ha cerrado , o está en el proceso de cerrar la conexión y si ya hemos dicho que se recicla después del close()
, entonces no recibirás datos de esta conexión, nunca más.
Si la conexión no se ha interrumpido, nuestro recv()
podría esperar eternamente, porque el socket no dirá, cuando no hay más nada por leer.
Por tanto, otra practica a tener en cuenta es saber qué hacer con el limite de la conexión, cerrarla, darle una longitud fija o delimitarla; pero, no hablaré en este articulo -que ya se ha hecho muy largo- de este tema.
Cerrar los sockets
Para Python cuando un socket es eliminado por el recolector de basura, automáticamente llama a close()
.
Esto elimina la posibilidad de que quede eternamente abierto, aunque confiar en esto es una mala práctica, porque puede no evitar que el socket del otro lado espere indefinidamente, pensando que su pareja solo esta siendo lenta y TCP es un protocolo confiable, que esperará un largo tiempo antes de rendirse con una conexión.
Por ello, lo recomendado es llamar a close(), siempre y cuando no estes usando hilos.
Sockets bloqueantes y no bloqueantes.
Todo lo que hemos visto hasta aquí, es el procedimiento para un socket bloqueante
En Python, se usa socket.setblocking(False)
para que un socket no sea bloqueante.
Se diferencia en que send()
, recv
()
, connect
()
y accept
()
pueden retornar sin haber hecho nada.
Debido a ello, se necesita leer el retorno de un modo óptimo. Un buena solución es emplearse la función select()
Usando select.
ready_to_read, ready_to_write, in_error = \
select.select(
potential_readers,
potential_writers,
potential_errs,
timeout)
A select()
se le pasan tres listas: la primera con todos los sockets que puede intentar leer; la segunda con todos los sockets que puede intentar escribir, y la tercera, qué usualmente se deja vacía, incluye a aquellos a los que se quiera verificar los errores.
Teniendo en cuenta su complejidad, es muy probable que necesites colocar un socket en más de una lista.
Aunque la llamada a select()
, se comporta como bloqueante, acepta darle un tiempo de espera largo.
El retorno de la función devuelve igualmente tres listas, que contienen los sockets que son realmente legibles, escribibles y con error. Cada una de estas listas es un subconjunto (posiblemente vacío) de la lista correspondiente que se pasó a select()
.
Cuando un socket está en la lista retornada legible, eso significa que una llamada a recv()
en este socket va a retornar algo, y lo mismo para la lista de escribibles, ese socket será capaz de mandar algo y eso solo significa que el espacio de salida del buffer de red está disponible.
En caso de que se necesite revisar a un socket servidor, debe ir en la lista de potenciales legibles y si retorna como legible es casi seguro que una llamada a accept()
va a funcionar.
Si se posee un nuevo socket para llamar a connect()
y conectarlo con otro, debe ir en la lista de potenciales escribibles, y si retorna como escribible, es que seguramente esta conectado.
select()
puede ser útil incluso con sockets bloqueantes, ya que el socket retorna como leíble cuando hay algo en el buffer, no obstnte vale aclarar que esto no sirve de ayuda con el problema de determinar si el socket al otro lado culminó la conexión, o solo está ocupado.
Y hasta aquí, espero modestamente, que esto sirva de ayuda a alguien.
Tres cosas necesitan las ovejas para andar en manada, el miedo al perro, la voz de amo y que la de atrás empuje, por miedo a quedarse sola.
Y.