Aumentando la resiliencia en clústeres activos-activos bare-metal: arquitectura del plano de control de 4 y 5 nodos ( versión 4.17 ⬠)
Las organizaciones que ejecutan implementaciones activo-activo en dos ubicaciones , especialmente aquellas que alojan cargas de trabajo con estado, como las mÔquinas virtuales de OpenShift Virtualization que ejecutan una sola instancia , dependen en gran medida de la infraestructura subyacente para garantizar la disponibilidad. Si bien las plataformas de virtualización tradicionales manejan esto de forma nativa, ejecutar estas cargas de trabajo en OpenShift bare metal introduce nuevas consideraciones arquitectónicas.
En los clĆŗsteres de OpenShift extendidos tĆpicos, el plano de control a menudo se implementa en una topologĆa 2+1 o 1+1+1 . Pero si el centro de datos que aloja la mayorĆa de los nodos del plano de control se cae:
El nodo del plano de control superviviente se convierte en la única fuente de información veraz para el clúster.
Ese Ćŗnico nodo debe cambiar al modo de lectura y escritura y actuar como la copia exclusiva de etcd.
Si ese nodo falla⦠la recuperación se vuelve catastrófica , especialmente al ejecutar mÔquinas virtuales con estado.
Este riesgo se vuelve aĆŗn mĆ”s crĆtico en entornos que aprovechan OpenShift Virtualization para cargas de trabajo de producción
La solución: Plano de control de 4 y 5 nodos para clĆŗsteres extendidos š
Para aumentar la resiliencia durante fallas a nivel de centro de datos, OpenShift puede aprovechar implementaciones de plano de control de 4 o 5 nodos , como:
2+2
3+2
Con estos diseños, incluso si se pierde un sitio completo, la ubicación restante conserva dos copias de solo lectura de etcd , lo que aumenta significativamente la capacidad de recuperación del clúster y reduce el riesgo de perder el quórum
Actualmente, el operador cluster-etcd ya admite hasta cinco miembros etcd , con escalado automƔtico en entornos que utilizan MachineSets. Sin embargo, en instalaciones bare-metal o basadas en agentes , MachineSets no estƔ disponible, lo que significa que el operador no escalarƔ automƔticamente, sino que ajustarƔ los pares etcd cuando se agreguen manualmente nodos del plano de control .
Este es exactamente el flujo de trabajo que pretendemos validar y admitir oficialmente.
š§ Nota: Esta capacidad estĆ” especĆficamente dirigida a clĆŗsteres bare-metal , con un fuerte enfoque en los casos de uso de virtualización de OpenShift .
Objetivos šÆ
Validar y admitir arquitecturas de plano de control de 4 y 5 nodos para clĆŗsteres bare-metal extendidos, bajo las siguientes restricciones:
Nodos de plano de control bare-metal
Instalado medianteĀ el instalador asistidoĀ oĀ el instalador basado en agentes
Red de capa 3Ā compartidaĀ entre ubicaciones
Latencia < 10 msĀ entre todos los nodos del plano de control
Ancho de bandaĀ mĆnimo de 10 Gbps
etcd almacenado enĀ SSD o NVMe
Criterios de aceptación āļø
š Rendimiento
El rendimiento y la escalabilidad del plano de control deben mostrar una degradación inferior al 10 % en comparación con los clústeres HA estÔndar.
En este Link podremos acceder al Veeam Size Estimator, una herramienta extremadamente útil para estimar el tamaño de tus datos respaldados. PodrÔs determinar cuÔnto espacio de almacenamiento necesitarÔs para tus copias de seguridad y asà planificar adecuadamente los recursos requeridos.
El Veeam Size Estimator te permite ingresar diferentes parÔmetros, como la cantidad de mÔquinas virtuales, el tamaño de los discos, el nivel de cambio diario y la retención deseada, entre otros. A partir de estos datos, la herramienta realiza cÔlculos complejos y te proporciona un estimado detallado sobre el espacio de almacenamiento necesario y el crecimiento esperado en el tiempo. Esto es especialmente útil para empresas de todos lostamaños que desean garantizar que su infraestructura de respaldo cumpla con los requisitos de capacidad y rendimiento.
No dudes en aprovechar esta herramienta y estar un paso adelante en la protección de tus datos crĆticos.
š Empecemos š¤ Paso 1
Podemos ir aƱadiendo algunos sitios. Un sitio actĆŗa como un mecanismo de grupo para recursos como repositorios y cargas de trabajo. Se supone que los recursos del sitio estĆ”n bien conectados. Por lo general, un sitio es un centro de datos o una ubicación fĆsica. Por ejemplo, en un entorno de producción, es posible que tengas un centro de datos en Peru y Argentina. En este caso, puede crear un sitio para representar cada ubicación, una llamada Londres y la otra. Puede optar por generar automĆ”ticamente un repositorio predeterminado en cada sitio para crear una copia de seguridad local. De forma predeterminada, el asistente crea 2 sitios que representan un diseƱo simple de dos centros de datos. Si estĆ”s satisfecho con este diseƱo simple, no tienes que cambiar nada y puedes seguir con el siguiente paso.
š Paso 2
Los repositorios pueden representar un repositorio de copia de seguridad Ćŗnico o un repositorio de Scale-Out. Como esta en la imagen hemos creado 1 repositorio por sitio que permite una copia fuera del sitio.
Opcionalmente, puede configurar los datos de copia de seguridad por niveles en la nube (Object Storage) en este paso, de la manera que lo harĆa en VBR.
Los perfiles son preajustes que puedes reutilizar en las pestañas de carga de trabajo. El perfil o preajuste mÔs relevante es el perfil de retención, que le permite definir su retención para sus copias de seguridad. Al definirlo por separado, puede (re)utilizarlos al definir sus cargas de trabajo y adaptarlos rÔpidamente para simular diferentes SLA.
Consejo: Establezca su perfil principal como el perfil predeterminado en cualquiera de las pestaƱas. Cuando creas una nueva carga de trabajo, el ajuste preestablecido predeterminado se seleccionarƔ automƔticamente.
Hay 4 tipos principales
Retención: define el SLA, por lo general cargas de trabajo similares comparten el mismo SLA. Por lo general, esta es la cantidad de incrementales (diarios) + los Fulls de GFS que quieres mantener. Consulte la documentación de Veeam Backup & Replication
Ventanas de copia de seguridad: definen el tiempo mĆ”ximo que el sistema puede ocupar para hacer una copia de seguridad de una determinada carga de trabajo. Esto tiene un impacto en el tamaƱo de la CPU y la memoria. Si la ventana de copia de seguridad es mĆ”s pequeƱa para las mismas cargas de trabajo, el sistema debe hacer una copia de seguridad de mĆ”s cargas de trabajo en paralelo. Una ventana de copia de seguridad tiene 2 ajustes, incrementales y completos. Incremental es el tiempo que se suele utilizar para ejecutar una copia de seguridad. La ventana de copia de seguridad completa es la cantidad de tiempo que el sistema puede tardar en hacer una copia de seguridad completa. Por lo general, ejecutar una copia de seguridad completa es una rara opción o se puede extender a lo largo de varios dĆas con mĆŗltiples trabajos. Es por eso que, por lo general, estas ventanas son mĆ”s grandes, ya que es poco comĆŗn hacer una copia de seguridad de toda la carga de trabajo a la vez, excepto al principio
Propiedades de los datos: define cómo se comportan los datos a lo largo del tiempo. Por ejemplo, describe la tasa de cambio diario o el crecimiento anual. Las propiedades de los datos suelen compartirse entre cargas de trabajo similares.
General: Ajustes generales que se aplican en todo el tamaƱo, independientemente de las cargas de trabajo individuales.
š Paso 4
El VSE se centra en las cargas de trabajo. Las cargas de trabajo representan mĆ”quinas virtuales, mĆ”quinas fĆsicas de Windows u otros conjuntos de datos que requieren una copia de seguridad. Las cargas de trabajo son un mecanismo para agrupar ciertos tipos de conjuntos de datos. Por ejemplo, 3 mĆ”quinas virtuales SQL de cada 1 TB de tamaƱo requieren estar protegidas con un SLA similar. En este caso, se puede crear una sola carga de trabajo Ā«VM SQLĀ» de tipo VM con un tamaƱo de fuente de 3 TB e instancias o unidades establecidas en 3 (represeniendo 3 mĆ”quinas virtuales). De manera similar, si tiene 4 mĆ”quinas fĆsicas Linux, puede crear una carga de trabajo y establecer el tamaƱo de la fuente en la suma de todos los datos actualmente consumidos en el disco en estas mĆ”quinas fĆsicas. En este caso, establezca la carga de trabajo en el tipo Ā«AgenteĀ»
Las cargas de trabajo se ejecutan en servidores fĆsicos directamente (copia de seguridad basada en agentes) o virtualmente en un hipervisor. Estas mĆ”quinas fĆsicas se encuentran en una ubicación fĆsica a menudo conocida como centro de datos o sitio. Los sitios le permiten presentar esta ubicación fĆsica y asignarles las cargas de trabajo para que la herramienta de tamaƱo sepa dónde se encuentran. Le permiten agrupar las cargas de trabajo y los repositorios que documentan el diseƱo actual de un entorno de producción.
Los repositorios son repositorios de Veeam Backup & Replication en los que puede hacer una copia de seguridad de los datos de sus cargas de trabajo. Representan activos de infraestructuras fĆsicas como un servidor x64, dispositivos NAS, etc. EstĆ”n ubicados dentro de un sitio. Por lo general, las cargas de trabajo se respaldan en un repositorio local (en el mismo sitio) y se copian en un repositorio externo. Se puede configurar la copia entre sitios.
Sin embargo, esto se produce con un mayor consumo de almacenamiento en un factor potencial de 4 durante la copia de seguridad incremental. Sin embargo, según la experiencia de campo, este factor es mÔs probable que sea 2x. Esto se debe a que los sistemas de archivos modernos intentan mantener juntos los bloques de datos para el mismo archivo de una manera secuencial que mitiga el impacto de un tamaño de bloque mÔs grande.
Por Ćŗltimo, mĆŗltiples cargas de trabajo podrĆan compartir caracterĆsticas similares. Es por eso que se abstraen en los perfiles. Esto elimina las necesidades de redefinirlos una y otra vez. El perfil predeterminado se seleccionarĆ” cuando agregue una carga de trabajo, por lo que es una buena idea establecerlo como predeterminado cuando haya un perfil que cubra la mayorĆa de las cargas de trabajo.
š Paso 5 Resultados š
Aqui vemos como resultado los Cores y la Memoria RAM que necesitaran los componentes de Veeam para el entorno que hemos propuesto & la capacidad de Storage del mismo.
Espero que les haya servido !!!
Aqui Tambien les dejo como realizar estos calculos manualmente
Les cuento un poco de mi, Soy Esteban Prieto vivo en Argentina – Buenos Aires, actualmente trabajo como System Engineer en VMware, soy Veeam Vanguard 2019/21 Class šÆ y Veeam Legend First Class 2021 šØāš.
En ambas comunidades nos tienen muy encuenta y podemos influir en el desarrollo de productos y soluciones de Veeam: ”tenemos un impacto real dentro de la comunidad!
En cada proyecto de nuevas versiones nos hacen parte y para el lanzamiento de la gran V11 de Veeam Backup & Replication tuvimos acceso a todos los betas, dando nuestro feedback de cada feature nuevo. Esto nos motiva aĆŗn mas para dar a conocer y promover a todos los clientes de Veeam cada mejora que obtendran.
Para finalizar agrego otros beneficios que tenemos por ser parte de los programas:
Una invitación al grupo privado Veeam Legends / Vanguard
Permiso para usar el logotipo de Veeam Legends/Vanguard en tarjetas, sitio web, etc. durante un aƱo
Seminarios web privados con socios de Veeam
Acceso a NFR, betas privadas y sesiones informativas previas al lanzamiento
Veeam Backup & Replication comprueba si la cadena de replicación contiene puntos de restauración a largo plazo obsoletos.
Si existe un punto de restauración desactualizado, Veeam Backup & Replication reconstruye el archivo que contiene datos para el disco base ( <disk_name> – flat.vmdk) para incluir datos del archivo que contiene datos para el disco delta ( <disk_name> – <index > .vmdk). Para hacer eso, Veeam Backup & Replication se compromete en los datos del archivo del disco base desde el archivo delta disk mĆ”s antiguo. De esta manera, el archivo del disco base ‘avanza’ en la cadena de replicación
3. Veeam Backup & Replication elimina el archivo de disco delta mƔs antiguo de la cadena como redundante; estos datos ya se han incluido en el archivo de disco base.
Veeam Backup & Replication comprueba si la cadena de replicación contiene puntos de restauración a corto plazo obsoletos.
Si existe un punto de restauración desactualizado, Veeam Backup & Replication envĆa los datos del punto de restauración desde el archivo de registro de transacciones (.tlog) al archivo de disco base o delta mĆ”s cercano ( <nombre_disco> – flat.vmdk o <nombre_disco> – <Ćndice> .vmdk).
Si el archivo de registro de transacciones no contiene datos para otros puntos de restauración, Veeam Backup & Replication elimina el archivo de registro de transacciones como redundante; sus datos ya se han comprometido en el archivo de disco base o delta.
NOTA
Veeam Backup & Replication puede almacenar puntos de restauración a corto plazo durante un perĆodo mĆ”s largo que el especificado en la polĆtica de retención a corto plazo.
Hoy tengo la felicidad que me han elegido para el programa de Veeam Legends, una gran forma de compartir ideas, dudas, y conocimiento tecnico de Veeam. Un honor seguir contribuyendo desde las dos comunidades Veeam Legends y Veeam Vanguard !!
Ćnase al Centro de recursos de la comunidad de Veeam y participe en los proyectos de la comunidad de Veeam: ya sea que tenga muchas ideas de productos o si es un creador de contenido fructĆfero , Ā”nuestro sistema de recompensas lo cuenta todo! RecibirĆ” puntos e insignias por diferentes actividades dentro del Veeam Community Resource Hub, asĆ que observe su perfil. Veeam Legends se anunciarĆ” al final de cada aƱo. ĀæSigues aquĆ? Ā”AnĆmate y comienza tu viaje ahora!
Estos son los principios clave del sistema de recompensas de Veeam Legends:
El sistema de recompensas consta de puntos, insignias, rangos y clasificación.
Veeam Legend es una designación dentro del programa
Veeam Legends deberĆa ofrecer cierto nivel de contribución por mes para mantener el tĆtulo
Los puntos se restablecen anualmente para los niveles; Quedan insignias y rangos
Código de conducta de Veeam Legends
La comunidad es lo primero: siempre hemos puesto a la comunidad de Veeam en primer lugar en todo lo que hacemos. Nos gustarĆa que Veeam Legends fuera una continuación de los valores y creencias de Veeam al comportarse con respeto al interactuar con cualquier persona dentro y fuera de la comunidad.
AquĆ hay algunas reglas de la casa que esperamos seguir para asegurarnos de que este espacio siga siendo amigable:
No usar lenguaje profano, ofensivo, odioso, acosador, amenazante, violento u obsceno.
Aumentando la resiliencia en clĆŗsteres activos-activos bare-metal: arquitectura del plano de control de 4 y 5 nodos ( versión 4.17 ⬠) Las organizaciones que ejecutan implementaciones activo-activo en dos ubicaciones , especialmente aquellas que alojan cargas de trabajo con estado, como las mĆ”quinas virtuales de OpenShift Virtualization que ejecutan una sola instancia , dependen en gran medida de la infraestructura subyacente paraā¦
Todo lo mostrado aquĆ estĆ” incluido en todas las suscripciones de OpenShift. Al migrar desde VMware, una de las primeras dudas es cómo se trasladan los conceptos de red. Este post lo explica visualmente. Figure 1: Virtual Machine Networking in OpenShift Las VMs pueden conectarse a: Interfaces soportadas: Esto permite emular redes como las de VMwareā¦
Esta herramienta fue desarrollada para simplificar la identificación de puertos requeridos por el software Veeam. Estos deben estar operativos en su firewall entre cada componente de la infraestructura de Veeam Backup and Replication cuando elija usarlos
Seleccione las operaciones que desea realizar dentro de la infraestructura de Veeam.
Seleccione cada operación y cree una lista de cada opción en esta pÔgina, siga cada paso a medida que se desarrolla y una vez que aparezca «Agregar a la lista», estarÔ completo. Puede haber muchas opciones para cada operación, asà que lea cada opción con atención. Si desea agregar varias opciones similares, agregue cada una por separado, en cualquier momento puede volver a esta pÔgina y agregar operaciones adicionales, la herramienta es dinÔmica.
No olvide presionar «Enviar» .
Paso 2. Infraestructura
La pĆ”gina de Infraestructura ofrece los roles de componentes de infraestructura de Veeam que desea agregar,Ā como Proxy, Repositorios, Hipervisor u opciones de almacenamiento.Ā Agregue cada componente segĆŗn sea necesario para crear las opciones necesarias para el diseƱo.Ā ContinĆŗe agregando cada opción hasta que tenga una lista completa de las opciones que necesitarĆ”.Ā En este ejemplo, elijo HypervisorĀ
Parte superior de la pÔgina «Asignación de funciones» enumera los servidores que ha agregado y las funciones asignadas que se les asignaron.
Paso 3. Agregar servidores Paso 4. Asignar roles a servidores
Cuando seleccionamos las operaciones, la infraestructura con sus opciones, necesitamos poder asignarlas a los servidores para que podamos comprender cómo encajan.
En este punto tenemos roles y hemos agregado servidores, ahora necesitamos agregar cada rol a un servidor designado. usando el cuadro desplegable al lado de un rol en particular, puede elegir un servidor de la lista, una vez seleccionado el «MAPA» El botón se resaltarÔ y puede presionarlo para asignar ese rol a ese servidor en la pÔgina, la asignación de roles en la parte superior de la pÔgina cambiarÔ para reflejar que el servidor ahora tiene asignado el rol. Los servidores pueden tener múltiples roles y usted puede asignar el mismo servidor a otros roles para reflejar su diseño con precisión. Si ve un rol que no usarÔ pero que se agregó automÔticamente como «EM Server» (Administrador corporativo), puede presionar ignorar y el rol se eliminarÔ por completo (esto es irreversible actualmente). Una vez que haya verificado que todos los roles estÔn asignados correctamente a los servidores, puede enviar las opciones a la configuración.
Resultado
Tienes todos los puertos que usarƔs en estas operaciones y puedes exportar a XLS
Hola !! les traigo una herramienta super util para todos, vSAM recopila y resume la información de implementación de productos vSphere. Requiere las API de vSphere para los datos de implementación y produce un informe en PDF que el cliente puede consultar como parte de su proceso de revisión y planificación de la infraestructura Podesā¦
En este tema veremos sobre el diseƱo del repositorio.
Necesitamos considerar
La recomendación clave es seguir la  regla 3 -2-1 .
Calcule 1 nĆŗcleo y 4 GB de RAM por repository task slot.Ā El mĆnimo recomendado para un repositorio es de 2 nĆŗcleos y 8 GB de RAM.
Dimensionamiento
La cantidad recomendada de CPU para un repositorio es de 1 nĆŗcleo por ranura de tarea configurada concurrente en un servidor de repositorio. Configure como mĆnimo un servidor de repositorio de 2 nĆŗcleos y 8 GB de RAM para permitir que el sistema operativo responda mejor.
Al dimensionar los espacios de tareas en un repositorio, debe comprender cuƔndo y cuƔntos espacios de tareas se consumen. Cualquier proceso de escritura consumirƔ un espacio de tarea. Por lo tanto, hacer una copia de seguridad de 10 mƔquinas virtuales en un trabajo utilizando cadenas de copia de seguridad por trabajo solo escribirƔ un archivo (VBK / VIB) al final, por lo que consume una ranura de tarea.
Una tarea en el nivel de repositorio se consume de manera diferente que las tareas en el nivel de proxy. Si los Ā«archivos de respaldo por VMĀ» estĆ”n habilitados en el repositorio, cada VM procesada simultĆ”neamente consumirĆ” una tarea de repositorio, mientras que cada disco virtual de esta VM consumirĆ” una tarea de proxy (la proporción tĆpica es de 3 discos por VM)
Si el requisito principal para el proxy es 16 núcleos para el incremental, los núcleos para el repositorio serÔn 5 según una proporción de disco a mÔquina virtual de 3: 1(redondeado). Para calcular la RAM, esto se multiplica por el requisito de RAM de 4 GB por núcleo, lo que da como resultado 20 GB.
Cuando el resultado de su cĆ”lculo sea un servidor (virtual) muy pequeƱo, considere recursos adicionales para la sobrecarga del sistema operativo (1 Core / 4GB RAM adicional deberĆa ser suficiente). Normalmente, los tamaƱos tienden a ser de un mĆnimo de 4 nĆŗcleos / 16 GB para servidores virtuales o servidores fĆsicos con> 10 nĆŗcleos y 64 GB de RAM donde de todos modos hay suficientes recursos disponibles para el sistema operativo.
Al usar el sistema de archivos Windows ReFS, la recomendación es agregar 0.5 GB de RAM por TB de almacenamiento ReFS. Sin embargo, no tiene que escalar esto indefinidamente. 128 GB de RAM suelen ser suficientes para los requisitos de tareas, SO y ReFS si el tamaƱo total del volumen de ReFS del servidor es inferior a ~ 200 TB. SegĆŗn el tamaƱo de ReFS o los requisitos de la tarea, es posible que desee agregar mĆ”s memoria, pero no deberĆa ser necesario superar los 256 GB.