Economía digital

Tecnologías para el comercio electrónico

Introducción

En esta ocasión estudiaremos la forma en que la Web utiliza una arquitectura cliente / servidor para el despliegue de servicios digitales. Para solicitudes HTTP simples, una arquitectura de dos niveles funciona bien. El primer nivel es la computadora cliente y el segundo nivel es el servidor. Las interacciones web más complicadas, como el comercio electrónico, requieren la integración de bases de datos y software de procesamiento de pagos en una arquitectura de tres niveles o superior (n niveles).

Los sistemas operativos que se usan comúnmente en las computadoras del servidor web incluyen los sistemas operativos del servidor de Microsoft y varios sistemas operativos basados en UNIX como Linux. Los programas de servidor web más utilizados son Apache HTTP Server y Microsoft Internet Information Server, pero hay otras opciones que están creciendo en popularidad. Las computadoras de servidor web también ejecutan una variedad de programas de utilidad como Tracert, Telnet y FTP. Muchos administradores de servidores web también usan software que ayuda con la verificación de enlaces y las tareas de administración remota del servidor.

El problema del correo electrónico comercial no solicitado (spam) ha crecido dramáticamente en los últimos años. Los filtros de contenido, particularmente los filtros bayesianos ingenuos, pueden resolver el problema. Las organizaciones están utilizando una combinación de filtros a nivel de servidor y filtros a nivel de cliente para reducir el correo no deseado a niveles tolerables. Las estrategias implementadas recientemente que identifican la fuente de correos electrónicos no deseados y las bloquean han ayudado a detener la ola de correo no deseado.

Finalmente, el hardware del servidor web también es una consideración importante en el diseño de un sitio comercial en línea. Las computadoras del servidor deben elegirse y configurarse cuidadosamente. Los grandes sitios web que tienen muchas computadoras de servidor web utilizan hardware y software de equilibrio de carga para administrar sus volúmenes de alta actividad.

Desarrollo del tema

Conceptos básicos del servidor web

Los servidores Web son equipos que están diseñados para proporcionar acceso público a los archivos que se representan como páginas en las computadoras de los visitantes. Los sitios web que tienen muchos visitantes deben usar una gran cantidad de estas computadoras de servidor web para entregar archivos de páginas web de manera eficiente. Operar grandes cantidades de computadoras requiere la sincronización de sus actividades, dividiendo la carga de trabajo que cada computadora debe llevar. 

Cuando las personas usan el software del navegador web para formar parte de la web, sus computadoras se convierten en computadoras cliente web en una red mundial de cliente / servidor. Las arquitecturas cliente / servidor se usan en LAN, WAN y la Web. En una arquitectura cliente / servidor, las computadoras cliente suelen solicitar servicios, como impresión, recuperación de información y acceso a la base de datos del servidor que procesa las solicitudes de los clientes. Las computadoras que realizan la función de servidor generalmente tienen más memoria y unidades de disco más grandes y más rápidas que las computadoras cliente a las que sirven. 

Internet conecta muchos tipos diferentes de computadoras y otros dispositivos, cada uno con diferentes tipos de software de sistema operativo. La capacidad de una red para conectar dispositivos que utilizan diferentes sistemas operativos se llama neutralidad de plataforma. Dado que el software web es neutral para la plataforma, permite que estas computadoras se comuniquen entre sí de manera fácil y efectiva. Esta neutralidad de la plataforma fue un factor crítico en la rápida expansión y aceptación generalizada de la web. 

Antes de la neutralidad de la plataforma de Internet, las computadoras que estaban conectadas entre sí mediante líneas telefónicas arrendadas tenían que ejecutar el mismo software del sistema operativo o necesitaban un software de traducción que permitiera que cada computadora se comunicara con la otra. 

En la siguiente figura se muestra cómo la neutralidad de la plataforma web proporciona múltiples interconexiones entre una amplia variedad de computadoras cliente y servidor. 

Figura 1. Plataforma de neutralidad de la web.

El trabajo de una computadora servidor web es responder a las solicitudes de las computadoras cliente web. Los tres elementos principales de un servidor web son el hardware (computadoras y componentes relacionados), el software del sistema operativo y el software del servidor web. Las empresas seleccionan los elementos de hardware y software específicos para un sitio web determinado en función de la funcionalidad del sitio, la cantidad de visitantes que se espera que usen el sitio, la cantidad de páginas que esos visitantes verán durante una visita promedio, el tamaño de esas páginas (incluidos los gráficos y otros elementos de la página), y el número máximo probable de visitantes simultáneos.

Generación de contenido dinámico

Una página dinámica es una página web cuyo contenido está conformado por un programa en respuesta a las solicitudes de los usuarios, mientras que una página estática es una página inmutable recuperada de un archivo o conjunto de archivos almacenados en un servidor web. Las páginas dinámicas permiten que un servidor web proporcione páginas personalizadas en respuesta a consultas específicas de los visitantes del sitio. Estas páginas personalizadas se denominan contenido dinámico.

El contenido dinámico puede brindar al usuario una experiencia interactiva con el sitio web. El texto, los gráficos, los campos de formulario y otros elementos de la página web pueden cambiar en respuesta a la entrada del usuario u otras variables. Por ejemplo, los clientes que ingresan sus números de pedido pueden recibir páginas web dinámicas que muestran los detalles de sus pedidos.

-Para saber más-

¿Qué es Front-end y Backend, servidores web y clientes?

Los diseñadores de sitios web pueden incorporar contenido dinámico utilizando dos enfoques básicos.

Primer enfoque

En el primer enfoque, llamado scripting del lado del cliente, el software opera en el cliente web (el navegador) para cambiar lo que se muestra en la página web en respuesta a las acciones de un usuario (como los clics del mouse o la entrada de texto del teclado). En las secuencias de comandos del lado del cliente, los cambios se generan dentro del navegador utilizando software como JavaScript. El cliente web recupera un archivo del servidor web que incluye código (JavaScript, por ejemplo). El código indica al cliente web que solicite elementos de página específicos del servidor web y dicta cómo se mostrarán en el navegador web.

Segundo enfoque

En el segundo enfoque, llamado scripting del lado del servidor, un programa que se ejecuta en un servidor web crea una página web en respuesta a una solicitud de información específica de un cliente web. El contenido de la solicitud puede estar determinado por varias cosas, incluido el texto que un usuario ha ingresado en un formulario web en el navegador, texto adicional agregado al final de una URL, el tipo de navegador web que realiza la solicitud o simplemente el pasaje de tiempo. Por ejemplo, si ha iniciado sesión en un sitio de banca en línea y no ingresa ningún texto ni hace clic en ningún lugar de la página durante unos minutos, el servidor web puede finalizar su conexión y enviar una página a su navegador que indica que “su sesión ha expirado .»

Múltiples significados de «servidor»

Las computadoras que están conectadas a Internet y hacen que algunos de sus contenidos estén disponibles públicamente mediante el protocolo HTTP se denominan servidores web. Desafortunadamente, el término servidor es usado de muchas maneras diferentes por los profesionales de sistemas de información, lo cual puede ser confuso. Es probable que encuentre varios usos diferentes de esta palabra.

Un servidor es cualquier computadora utilizada para proporcionar (o «servir») archivos o poner a disposición programas para otras computadoras conectadas a través de una red (como una LAN o una WAN). El software que usa la computadora del servidor para hacer que estos archivos y programas estén disponibles para las otras computadoras a menudo se llama software de servidor. A veces, este software de servidor se incluye como parte del sistema operativo que se ejecuta en la computadora servidor. Por lo tanto, algunos profesionales de sistemas de información se refieren informalmente al software del sistema operativo en una computadora servidor como software de servidor, una práctica que agrega considerable confusión al uso del término.

Surgen problemas de terminología similares para las computadoras de servidor que realizan funciones de procesamiento de correo electrónico y administración de bases de datos. Recuerda que la computadora del servidor que maneja el correo electrónico entrante y saliente generalmente se llama servidor de correo electrónico, y el software que administra la actividad de correo electrónico en ese servidor con frecuencia se llama software de servidor de correo electrónico. La computadora servidor en la que se ejecuta el software de administración de bases de datos a menudo se denomina servidor de bases de datos. La computadora en la que una empresa ejecuta su software de contabilidad y gestión de inventario a veces se denomina servidor de transacciones.

Por lo tanto, la palabra servidor se usa para describir varios tipos de hardware y software de computadora, que se pueden encontrar en una operación típica de comercio electrónico. La única forma de determinar de qué servidor están hablando las personas cuando usan el término es desde el contexto o haciendo una pregunta aclaratoria. Si escucha a un técnico informático decir: El servidor está caído hoy, el problema podría estar en el hardware, el software o una combinación de ambos.

Imagen 1. Los servidores son parte indispensable de la infraestructura tecnológica para el comercio electrónico.

Cliente Web / Arquitecturas de Servidor

Cuando una persona usa un navegador web para visitar un sitio web, el navegador web (también conocido como cliente web) solicita archivos del servidor web de la empresa u organización que opera el sitio web. Usando Internet como medio de transporte, la solicitud es formateada por el navegador usando HTTP y enviada a la computadora del servidor. Cuando el servidor recibe la solicitud, recupera el archivo que contiene la página web u otra información solicitada por el cliente, lo formatea usando HTTP y lo envía de vuelta al cliente a través de Internet.

Cuando la información solicitada (un archivo que contiene el texto y las etiquetas de marcado de una página web, en este caso) llega a la computadora cliente, el software del navegador determina que la información es una página HTML. Muestra la página en la máquina cliente de acuerdo con las instrucciones definidas en el código HTML de la página. 

Este proceso se repite cuando el cliente lo solicita, el servidor responde y el cliente muestra el resultado. A veces, una solicitud de un solo cliente da como resultado docenas o incluso cientos de respuestas de servidor separadas para localizar y entregar información. Una página web que contiene muchos gráficos y otros objetos puede tardar en aparecer en la ventana del navegador web del cliente porque cada elemento de la página (cada archivo gráfico o multimedia) requiere una solicitud y respuesta por separado.

El modelo básico de cliente / servidor web es un modelo de dos niveles porque solo tiene un cliente y un servidor. Toda la comunicación se realiza en Internet entre el cliente y el servidor. Por supuesto, otras computadoras están involucradas en el envío de paquetes de información a través de Internet, pero los mensajes son creados y leídos solo por el cliente y las computadoras del servidor en una arquitectura cliente / servidor de dos niveles. La siguiente figura muestra cómo un cliente web y un servidor web se comunican entre sí en una arquitectura cliente / servidor de dos niveles.

Figura 2. El mensaje fluye en una red de cliente / servidor de dos niveles.

El mensaje que envía un cliente web para solicitar un archivo o archivos de un servidor web se denomina mensaje de solicitud. Un mensaje de solicitud típico de un cliente a un servidor consta de tres partes principales:

  • Línea de solicitud
  • Encabezados de solicitud opcionales
  • Entidad de entidad opcional

La línea de solicitud contiene un comando, el nombre del recurso de destino (un nombre de archivo y una descripción de la ruta a ese archivo en el servidor), y el nombre del protocolo y el número de versión. Los encabezados de solicitud opcionales pueden contener información sobre los tipos de archivos que el cliente aceptará en respuesta a esta solicitud. Finalmente, a veces se usa un cuerpo de entidad opcional para pasar información masiva al servidor.

Cuando el servidor recibe el mensaje de solicitud, ejecuta el comando incluido en el mensaje (en este caso, envía un archivo de página web particular al cliente). El servidor hace esto recuperando el archivo de la página web de su disco (u otro disco en una red a la que está conectado) y luego creando un mensaje de respuesta con el formato adecuado para enviarlo de regreso al cliente.

Software para servidores web

Algunos software de servidor web pueden ejecutarse en un solo sistema operativo de computadora, mientras que otros pueden ejecutarse en varios sistemas operativos. 

Sistemas operativos para servidores web

Las tareas del sistema operativo incluyen la ejecución de programas y la asignación de recursos informáticos, como memoria y espacio en disco, a los programas. El software del sistema operativo también proporciona servicios de entrada y salida a dispositivos conectados a la computadora, incluidos teclados, ratones, monitores, pantallas táctiles, escáneres e impresoras. Una computadora debe tener un sistema operativo para ejecutar programas. Para sistemas grandes, el sistema operativo tiene aún más responsabilidades, incluido el seguimiento de múltiples usuarios conectados al sistema y garantizar que no interfieran entre sí.

La mayoría del software de servidor web se ejecuta en productos de Microsoft Windows Server, Linux u otros sistemas operativos basados en UNIX como FreeBSD. Algunas compañías creen que el servidor de Microsoft y los productos de plataforma en la nube son más fáciles de aprender y usar para el personal de sus sistemas de información que los sistemas basados en UNIX. Otras compañías se preocupan por las debilidades de seguridad causadas por la estrecha integración entre el software de la aplicación y el sistema operativo en los productos de Microsoft. Los servidores web basados en UNIX son más utilizados, y muchos expertos de la industria creen que UNIX es un sistema operativo más seguro en el que ejecutar un servidor web.

Imagen 2. Los sistemas operativos (SO) son imprescindibles para el funcionamiento de máquinas físicas, pues sirven de intermediario entre los recursos materiales, el usuario y las diferentes aplicaciones. 

Servidor HTTP Apache

El Servidor HTTP Apache ha dominado la Web desde que estuvo ampliamente disponible porque es gratuito, funciona eficientemente y tiene una gran cantidad de usuarios expertos que contribuyen con asesoramiento técnico a foros de discusión en línea, wikis y blogs.

Apache se ejecuta en muchos sistemas operativos (incluidos FreeBSD-UNIX, HP-UX, Linux, Microsoft Windows, SCO-UNIX y Solaris). Varias compañías venden servicios de soporte para Apache para organizaciones que desean la seguridad adicional; sin embargo, la mayoría de las instalaciones de Apache son compatibles con el personal técnico de la organización que utiliza la ayuda gratuita en línea disponible.

-Para saber más-

Las plataformas web APACHE & NGINX

Servidor de información de Internet de Microsoft

Microsoft Internet Information Server (IIS) viene incluido con las versiones actuales de los sistemas operativos Microsoft Windows Server. IIS se usa en muchas intranets corporativas porque muchas compañías han adoptado los productos de Microsoft como sus productos estándar. Los sitios pequeños que ejecutan páginas web personales también usan IIS, al igual que algunos de los sitios de negocios en línea más grandes. IIS en sí es gratis; sin embargo, el software del sistema operativo Microsoft Windows Server con el que está empaquetado si tiene costo. IIS ejecuta la tecnología ASP de Microsoft de manera eficiente, lo que permite a los usuarios crear páginas web dinámicas.

Correo electrónico

Aunque la Web, con sus interacciones entre los servidores web y los clientes, es la tecnología más importante utilizada en el comercio electrónico en la actualidad, muchos compradores y vendedores también usan el correo electrónico para recopilar información, ejecutar transacciones y realizar otras tareas comerciales en línea. 

  • Beneficios por correo electrónico. El correo electrónico no solo fue una de las primeras aplicaciones de Internet, sino que también fue una de las razones por las que muchas personas se sintieron atraídas originalmente por Internet. El correo electrónico transmite mensajes de un destino a otro en unos segundos. Los mensajes pueden contener formatos de caracteres similares a los programas de procesamiento de texto y pueden incluir documentos, imágenes, audio, películas, hojas de trabajo u otros archivos. Estos archivos adjuntos pueden ser la parte más importante del mensaje. Hoy en día, el correo electrónico es la forma más popular de comunicación comercial, superando en gran medida el volumen de teléfono, correo convencional y fax.
  • Inconvenientes de correo electrónico. A pesar de sus muchos beneficios, el correo electrónico tiene algunos inconvenientes. Una molestia asociada con el correo electrónico es la cantidad de tiempo que los empresarios pasan respondiendo su correo electrónico hoy. Los investigadores han descubierto que la mayoría de los gerentes pueden manejar mensajes de correo electrónico a una velocidad promedio de aproximadamente cinco minutos por mensaje. Algunos mensajes se pueden eliminar en unos pocos segundos, pero estos se equilibran con los correos electrónicos que requieren que el gerente dedique un tiempo considerable a buscar datos, verificar archivos y realizar otras tareas como parte de la respuesta al correo electrónico. 

    Los investigadores han descubierto que la mayoría de las personas (sin incluir a las que responden correos electrónicos como su trabajo a tiempo completo) sienten que el correo electrónico es demasiado pesado cuando reciben 20 o 30 mensajes al día, lo que les lleva aproximadamente dos horas de su día a responder, investigar o manejar de otra manera.

    Una segunda irritación importante provocada por el correo electrónico es el virus informático, más simplemente conocido como virus, que es un programa que se adjunta a otro programa y puede causar daños cuando se activa el programa host. Los archivos adjuntos de correo electrónico pueden ser o pueden contener virus. El uso de software de protección antivirus y el manejo de amenazas de seguridad enviadas por correo electrónico es un costo que viene con el uso del correo electrónico.
  • Spam. Los investigadores que rastrean el spam creen que su crecimiento se ha estabilizado y que las soluciones técnicas continuarán reduciendo la cantidad de spam como un porcentaje del total  del tráfico de correo electrónico en el futuro. Varias compañías ahora ofrecen software que las organizaciones pueden ejecutar en sus computadoras de servidor de correo electrónico para limitar la cantidad de spam que llega a sus empleados. Aunque los usuarios individuales pueden instalar programas de filtrado de correo no deseado basados en el cliente en sus computadoras o establecer filtros dentro de su software de cliente de correo electrónico, la mayoría de las compañías consideran que es más efectivo y menos costoso eliminar el correo no deseado antes de que se descargue a las computadoras de los usuarios.
  • Soluciones al problema del spam. Mientras siga siendo económico enviar correos electrónicos (y, por lo tanto, spam), los beneficios obtenidos por los spammers seguirán siendo suficientes para convertirlo en una empresa atractiva. Los métodos utilizados para limitar el spam y sus efectos han tomado diversas formas. Algunos de estos enfoques requieren la aprobación de leyes, y algunos requieren cambios técnicos en los sistemas de manejo de correo de Internet. Se pueden implementar otros enfoques bajo las leyes existentes y con las tecnologías actuales, pero solo si un gran número de organizaciones y empresas cooperan. Los usuarios individuales de correo electrónico pueden llevar a cabo algunas tácticas que reducen el correo no deseado.
  • Tácticas antispam de usuarios individuales. Una forma en que las personas pueden limitar el spam es reducir la probabilidad de que un spammer pueda generar automáticamente sus direcciones de correo electrónico. Muchas organizaciones crean direcciones para sus empleados combinando elementos del nombre y apellido de cada empleado. Por ejemplo, muchas empresas a menudo combinan la primera letra del nombre de un empleado con el apellido completo para generar direcciones de correo electrónico para todos los empleados.
  • Filtrado de contenido básico. Todas las soluciones de filtrado de contenido requieren un software que identifique los elementos de contenido en un mensaje de correo electrónico entrante que indica que el mensaje es (o no) spam. Las técnicas de filtrado de contenido difieren en los elementos de contenido que examinan, si buscan indicaciones de que el mensaje es (o no) correo no deseado y cuán estrictamente aplican las reglas para clasificar los mensajes. La mayoría de los filtros de contenido básico examinan los encabezados de los correos electrónicos (De, Para, Asunto) y buscan indicaciones de que el mensaje puede ser spam. El software que realiza la tarea de filtrado se puede colocar en las computadoras de los usuarios individuales (llamado filtrado a nivel del cliente) o en las computadoras del servidor de correo (llamado filtrado a nivel del servidor). El filtrado a nivel de servidor se puede implementar en el servidor de correo de un ISP, el servidor de correo de una empresa individual o ambos.
  • Filtro de contenido de respuesta a desafío. Una técnica de filtrado de contenido utiliza una lista blanca como base para un procedimiento de confirmación. Esta técnica, llamada desafío-respuesta, compara todos los mensajes entrantes con una lista blanca. Si el mensaje es de un remitente que no está en la lista blanca, se envía una respuesta automática por correo electrónico al remitente. Este mensaje (el desafío) le pide al remitente que responda al correo electrónico (la respuesta). La respuesta debe contener una respuesta a un desafío presentado en el correo electrónico.
  • Filtrado de contenido avanzado. Los filtros de contenido avanzados que examinan todo el mensaje de correo electrónico pueden ser más efectivos que los filtros de contenido básico que solo examinan los encabezados de los mensajes o la dirección IP del remitente del correo electrónico. Sin embargo, crear filtros de contenido efectivos puede ser un desafío.
  • Soluciones técnicas. Internet no fue diseñado para hacer muchas de las cosas que hace hoy. No fue diseñado para ser seguro, para procesar transacciones o para manejar miles de millones de mensajes de correo electrónico. Como se diseñó originalmente, y tal como funciona hoy, Internet no incluyó ningún mecanismo para garantizar que la identidad de un remitente de correo electrónico siempre sea conocida por el destinatario del correo electrónico.

    Al menos una estrategia técnica para combatir el spam explota una debilidad en el diseño original de Internet. El protocolo de Internet que rige la comunicación entre los servidores en Internet (incluidos los servidores de correo electrónico) fue diseñado para ser un conjunto de reglas educadas. Cuando una computadora en Internet envía un mensaje a otra computadora, esperará para recibir un acuse de recibo de que el mensaje ha sido recibido antes de enviar más mensajes. En el curso normal de las comunicaciones por Internet, los mensajes de confirmación vuelven en menos de un segundo. Si una computadora está configurada para enviar el acuse de recibo más lentamente, la computadora de origen se ralentizará porque debe continuar buscando el acuse de recibo (que consume parte de su potencia de procesamiento) y no enviará más mensajes a esa dirección hasta que recibe el acuse de recibo.

    Las soluciones técnicas más efectivas para el problema del spam han sido los esfuerzos coordinados de los grandes usuarios de Internet para identificar las fuentes de spam y bloquearlas. A medida que más y más actividades de spam se trasladan a países que tienen regulaciones laxas con respecto al spam, se ha vuelto más fácil identificar y bloquear a estos usuarios. Las reducciones recientes en el nivel de spam son probablemente el resultado de estos esfuerzos.

Programas utilitarios para internet

Además del software del servidor web, las personas que desarrollan sitios web trabajan con una serie de programas o herramientas de utilidad. TCP / IP admite una amplia variedad de estos programas de utilidad. Algunos de estos programas se ejecutan en el servidor web, mientras que otros se ejecutan en las computadoras cliente que los desarrolladores web utilizan cuando crean sitios web. El correo electrónico fue uno de los primeros programas de servicios de Internet y se ha convertido en uno de los más importantes.

Tracert y otros programas de trazado de ruta

Tracert (TRACE RouTe) envía paquetes de datos a cada computadora en el camino (Internet) entre una computadora y otra computadora y registra los tiempos de ida y vuelta de los paquetes. Esto proporciona una indicación del tiempo que tarda un mensaje en viajar de una computadora a otra y viceversa, asegura que la computadora remota esté en línea y señala cualquier congestión de tráfico de datos. Los programas de trazado de ruta también calculan y muestran el número de saltos entre computadoras y el tiempo que se tarda en recorrer todo el camino unidireccional entre máquinas.

Utilidades Telnet y FTP

Telnet es un programa que permite a una persona que usa una computadora acceder a archivos y ejecutar programas en una segunda computadora que está conectada a Internet. Esta capacidad de inicio de sesión remoto puede ser útil para ejecutar software antiguo que no tiene una interfaz web. Telnet permite que una computadora cliente de comandos a los programas que se ejecutan en un host remoto, lo que permite la resolución remota de problemas o la administración del sistema. A medida que más compañías colocan información en páginas web, a las que se puede acceder a través de cualquier navegador web, el uso de Telnet continuará disminuyendo.

El Protocolo de transferencia de archivos (FTP) es la parte de las reglas de TCP / IP que define los formatos utilizados para transferir archivos entre computadoras conectadas a TCP / IP. Aunque muchas transferencias de archivos FTP y operaciones de administración de archivos se pueden realizar directamente a través de un navegador web, la mayoría de las personas usan software como FileZilla o CuteFTP para realizar estas tareas.

Imagen 3. El FTP es muy popular entre los desarrolladores de sitios de internet.

Programas de utilidad de indexación y búsqueda

Los motores de búsqueda y los programas de indexación son elementos importantes de muchos servidores web. Los motores de búsqueda o las herramientas de búsqueda buscan documentos solicitados en un sitio específico o en toda la Web. Un programa de indexación puede proporcionar indexación de texto completo que genera un índice para todos los documentos almacenados en el servidor. Cuando un navegador solicita una búsqueda en el sitio web, el motor de búsqueda compara los términos del índice con el término de búsqueda del solicitante para ver qué documentos contienen coincidencias para el término o términos solicitados.

Utilidades de comprobación de enlaces

Con el tiempo, los sitios web a los que enlaza una página determinada pueden cambiar sus URL o incluso desaparecer. Un enlace muerto, cuando se hace clic, muestra un mensaje de error en lugar de una página web. A veces se dice que los sitios que tienen muchos enlaces muertos tienen enlaces podridos. Un programa de utilidad de comprobación de enlaces examina cada página del sitio e informa de cualquier URL que ya no exista. También puede identificar archivos huérfanos, que son archivos en el servidor web que no están vinculados a ninguna página web. Otras características importantes de administración del sitio incluyen la verificación de scripts y la validación de HTML.

Algunas herramientas de administración pueden localizar páginas y códigos cargados de errores, enumerar enlaces rotos y enviar resultados de mantenimiento por correo electrónico a los administradores del sitio. Algunas herramientas de desarrollo y mantenimiento de sitios web, como Dreamweaver de Adobe, incluyen funciones de verificación de enlaces.

Administración remota del servidor

Con el software de administración remota del servidor, el administrador de un sitio web puede controlar un sitio web desde cualquier computadora conectada a Internet. Es conveniente que un administrador pueda monitorear la actividad del servidor y manipular el servidor desde donde sea que se encuentre.

Existen diversas compañías que venden software que incluye funciones de administración remota junto con verificación de enlaces, solución de problemas de HTML, monitoreo de sitios y otros programas de utilidad que pueden ser útiles para administrar el funcionamiento de un sitio web.

Hardware del servidor web

Las organizaciones usan una amplia variedad de marcas, tipos y tamaños de computadoras para alojar sus operaciones en línea. Las empresas muy pequeñas pueden ejecutar sitios web en PC de escritorio. Sin embargo, la mayoría de los sitios web de comercio electrónico funcionan en computadoras diseñadas específicamente para la tarea de alojamiento de sitios web.

Computadoras de servidor

Las computadoras de servidor web generalmente tienen más memoria, unidades de disco duro más grandes (y más rápidas) y procesadores más rápidos que la computadora de escritorio típica. Muchas computadoras de servidor web usan múltiples procesadores; Muy pocas PC de escritorio tienen más de un procesador. Debido a que las computadoras de servidor web usan elementos de hardware más rápidos y de mayor capacidad (como memoria y unidades de disco duro) y usan más de estos elementos, generalmente son mucho más caros que las PC de estaciones de trabajo.

Aunque algunas computadoras de servidor web están alojadas en casos independientes, la mayoría se instalan en bastidores de equipos. Estos bastidores son generalmente de unos 6 pies de alto y 19 pulgadas de ancho. Cada uno puede contener entre 10 y 20 servidores de tamaño medio. Una configuración de servidor cada vez más popular implica colocar pequeñas computadoras de servidor en una sola placa de computadora y luego instalar muchas de esas placas en un marco montado en bastidor.

Imagen 4. Una configuración de servidor cada vez más popular implica colocar pequeñas computadoras de servidor en una sola placa de computadora y luego instalar muchas de esas placas en un marco montado en bastidor.

Servidores web y computación verde

El uso de grandes colecciones de computadoras, especialmente computadoras poderosas como servidores web, requiere cantidades significativas de energía eléctrica para funcionar. Aunque gran parte de esta energía eléctrica se usa para operar los servidores, una parte sustancial se usa para enfriar las habitaciones en las que residen los servidores. Las computadoras grandes generan enormes cantidades de calor. Los esfuerzos para reducir el impacto ambiental de las grandes instalaciones informáticas se denominan informática ecológica. Las compañías que operan una gran cantidad de computadoras de servidor web están encontrando formas muy interesantes de minimizar el impacto del uso de tanta electricidad y el calor que genera.

En 2009, Google abrió una instalación de servidor en Finlandia en un edificio que anteriormente se usaba como fábrica de papel. Esta instalación se encuentra cerca de la costa y está construida sobre túneles de granito que extraen el agua de mar que Google usa en lugar de aire acondicionado eléctrico para disipar el calor generado por los servidores. Las bajas temperaturas promedio en Finlandia reducen la necesidad general de enfriamiento también.

Hewlett-Packard utiliza aire frío disponible en las altas altitudes de las Montañas Rocosas en su instalación de servidores de Fort Collins, Colorado. FedEx y Harris Corporation también han utilizado refrigeración natural en sus instalaciones de servidores web de EE. UU.

Todos estos esfuerzos reducen el impacto que las empresas en línea tienen en los recursos energéticos limitados del planeta. También pueden proporcionar ahorros sustanciales de costos de energía para las empresas que utilizan estas estrategias.

Evaluación del rendimiento del servidor web

Las combinaciones de hardware y software de servidor web de evaluación comparativa pueden ayudar a tomar decisiones informadas para un sistema. La evaluación comparativa, en este contexto, es una prueba que se utiliza para comparar el rendimiento del hardware y el software.

Los elementos que afectan el rendimiento general del servidor incluyen hardware, software del sistema operativo, software del servidor, ancho de banda de conexión, capacidad del usuario y tipo de páginas web que se entregan. El número de usuarios que el servidor puede manejar también es importante. Esto puede ser difícil de medir porque tanto el ancho de banda de la conexión a Internet como el tamaño de las páginas web entregadas pueden afectar ese número. Dos factores a evaluar al medir la capacidad de entrega de la página web de un servidor son el rendimiento y el tiempo de respuesta. El rendimiento es la cantidad de solicitudes HTTP que una combinación particular de hardware y software puede procesar en una unidad de tiempo. El tiempo de respuesta es la cantidad de tiempo que requiere un servidor para procesar una solicitud.

Una forma de elegir las configuraciones de hardware del servidor web es ejecutar pruebas en varias configuraciones, lo que puede ser difícil para el equipo que aún no se ha comprado. 

Sistemas de equilibrio de carga

Un conmutador de equilibrio de carga es una pieza de hardware de red que monitorea las cargas de trabajo de los servidores conectados y asigna el tráfico web entrante al servidor que tiene la mayor capacidad disponible en ese instante. En un sistema simple de equilibrio de carga, el tráfico que ingresa al sitio desde Internet a través del enrutador del sitio encuentra el interruptor de equilibrio de carga, que luego dirige el tráfico al servidor web que mejor puede manejar el tráfico. La siguiente figura muestra un sistema básico de equilibrio de carga.

Figura 3. Sistema básico de equilibrio de carga.

En sistemas de equilibrio de carga más complejos, el tráfico web entrante, que puede ingresar desde dos o más enrutadores en un sitio web más grande, se dirige a grupos de servidores web dedicados a tareas específicas. En el complejo sistema de equilibrio de carga que aparece en

En la siguiente figura, los servidores web se han reunido en grupos de servidores, cada uno de los cuales maneja una función específica, que incluye: entrega de páginas HTML estáticas, consulta de una base de datos de información, generación y entrega de páginas web dinámicas y procesamiento de transacciones.

Figura 4. Sistema complejo de equilibrio de carga.

-Para saber más-

¿Qué es el cloud computing?

Conclusión

Espero que los conocimientos que has adquirido hasta ahora vayan fortaleciendo nuestro objetivo. En esta lección pudiste profundizar en las siguientes ideas:

  • Cómo un servidor web realiza sus funciones básicas.
  • Qué sistema operativo y software de servidor se utiliza en los servidores web.
  • Cómo identificar y gestionar el correo electrónico y los problemas de control de spam.
  • Cómo funcionan comúnmente los programas de utilidad de Internet y sitios web.
  • Qué hardware utilizan las empresas en línea para impulsar sus sitios web.

Autor. Dr. Roberto José Muñoz Mújica