funcionar funciona

by arivero - opened Jan 20, 2025

Jan 20, 2025

Lo que no tengo claro es si son muchos o pocos tokens por segundo, los que da el vLLM. Supongo que es por ser de pocas frases el ejemplo.

con 4*h100 saca 134 t/s
Processed prompts: 100%|███████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 5.36it/s, est. speed input: 64.35 toks/s, output: 134.06 toks/s]Prompt: 'Las fiestas de San Isidro Labrador de Yecla son', Generated text: ' unas celebraciones que se celebran en la localidad española de Yecla, Murcia. Se trata del patrón de esta ciudad y'Prompt: 'El punt més alt del Parc Natural del Montseny és', Generated text: " el Turó de l’Home, amb 1.706 metres d'altitud sobre la serra de Collform"Prompt: 'Sentence in English: The typical chance of such a storm is around 10%. Sentence in Catalan:', Generated text: " La probabilitat típica d'una tempesta com aquesta és al voltant del 10%\nSentence in Spanish:"Prompt: 'Si le monde était clair', Generated text: ", il n’y aurait pas d’art. » (Oscar Wilde)\n« L'artiste est celui qui sait"Prompt: 'The future of AI is', Generated text: ' bright, and it’s only going to get brighter. With the advent of artificial intelligence (AI), we are seeing'INFO 01-20 20:10:05 multiproc_worker_utils.py:127] Killing local vLLM worker processes

y en 4*L40S un poco menos, pero no mucho menos, 102 tokens/segundo

:Processed prompts: 100%|███████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00, 4.09it/s, est. speed input: 49.09 toks/s, output: 102.28 toks/s]Prompt: 'Las fiestas de San Isidro Labrador de Yecla son', Generated text: ' unas celebraciones que se celebran en la localidad española de Yecla, Murcia. Se trata del patrón de esta ciudad y'Prompt: 'El punt més alt del Parc Natural del Montseny és', Generated text: " el Turó de l’Home, amb 1.706 metres d'altitud sobre la serra de Collform"Prompt: 'Sentence in English: The typical chance of such a storm is around 10%. Sentence in Catalan:', Generated text: " La probabilitat típica d'una tempesta com aquesta és al voltant del 10%.\nSentence in Spanish:"Prompt: 'Si le monde était clair', Generated text: ", il n’y aurait pas d’art. » (Oscar Wilde)\nLorsque l'on parle de"Prompt: 'The future of AI is', Generated text: ' bright, and it’s only going to get brighter. With the advent of artificial intelligence (AI), we are seeing'ERROR 01-20 20:19:14 multiproc_worker_utils.py:123] Worker VllmWorkerProcess pid 3545108 died, exit code: -15

un mosqueo de vLLM es que debe emplear otra libreria distinta para conectarse a huggingface, asi que hay que ir probando las recetas de https://stackoverflow.com/questions/71692354/facing-ssl-error-with-huggingface-pretrained-models hasta que vez cual funciona para que chute el https.

peterJohn2024

Feb 6, 2025

Hola, yo lo estoy probando con maquina virtual vmware fusion sobre imac, y si no le asigno 500 GB al disco, no va. Ahora con Kali Linux no va porque, supongo, el tmp solo tiene 1Gb y no le alcanza, asi que nada, ubuntu via vmware y va bien hasta que instalo las librerias en virtualenv de python. ya cuando compile te dire porque ahi se pone a bajar tensor 17 o 18 unidades de 6 o 7 GB cada uno y eso necesita "algo" de espacio. Este mac tiene bastantes GB ram pero no lo veo en uno con 4 GB u 8 GB. asi que no sera algo que pueda instalar mucha gente, supongo

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment