Spaces:

Mistral-AI-Game-Jam
/

description-improv

Running

description-improv / src /lib /wordProcessing.ts

Felix Zieger

update

65676ec 9 months ago

789 Bytes

	import nlp from 'compromise';

	export const normalizeWord = (word: string, language: string = 'en'): string => {
	let processedWord = word;

	// Only apply compromise for English
	if (language === 'en') {
	const doc = nlp(word);
	processedWord = doc.nouns().toSingular().out('text');

	// Handle cases where compromise doesn't produce output
	if (!processedWord) {
	processedWord = word;
	}
	}

	// Apply standard normalization for all languages
	return processedWord
	.normalize('NFD')
	.replace(/[\u0300-\u036f]/g, '')
	.toLowerCase()

	// Handle German umlauts and their alternative spellings
	.replace(/ü/g, 'ue')
	.replace(/ä/g, 'ae')
	.replace(/ö/g, 'oe')
	.replace(/ß/g, 'ss')

	.replace(/[^a-z]/g, '')
	.trim();
	};