SentenceTransformer based on google/embeddinggemma-300m

This is a sentence-transformers model finetuned from google/embeddinggemma-300m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: google/embeddinggemma-300m
  • Maximum Sequence Length: 2048 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
  (3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
  (4): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("tamiltheorist/tamil_embedding")
# Run inference
queries = [
    "\u0ba4\u0bae\u0bbf\u0bb4\u0bcd \u0bae\u0bca\u0bb4\u0bbf\u0b95\u0bcd\u0b95\u0bc1 \u0027\u0baa\u0bca\u0bb1\u0bcd\u0b95\u0bbe\u0bb2\u0bae\u0bcd\u0027 \u0b8e\u0ba9\u0bcd\u0bb1\u0bc1 \u0bb5\u0bbf\u0bb5\u0bb0\u0bbf\u0b95\u0bcd\u0b95\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0bae\u0bcd \u0bb5\u0bb0\u0bb2\u0bbe\u0bb1\u0bcd\u0bb1\u0bc1 \u0b95\u0bbe\u0bb2\u0b95\u0b9f\u0bcd\u0b9f\u0bae\u0bcd \u0b8e\u0ba4\u0bc1, \u0bae\u0bc7\u0bb2\u0bc1\u0bae\u0bcd \u0b85\u0ba8\u0bcd\u0ba4\u0b95\u0bcd \u0b95\u0bbe\u0bb2\u0b95\u0b9f\u0bcd\u0b9f\u0ba4\u0bcd\u0ba4\u0bbf\u0bb2\u0bcd \u0ba8\u0b9f\u0ba8\u0bcd\u0ba4 \u0bae\u0bc1\u0ba4\u0bb2\u0bcd \u0b87\u0ba8\u0bcd\u0ba4\u0bbf \u0b8e\u0ba4\u0bbf\u0bb0\u0bcd\u0baa\u0bcd\u0baa\u0bc1\u0baa\u0bcd \u0baa\u0bcb\u0bb0\u0bbf\u0bb2\u0bcd \u0bae\u0baf\u0bbf\u0bb2\u0bc8 \u0b9a\u0bc0\u0ba9\u0bbf. \u0bb5\u0bc7\u0b99\u0bcd\u0b95\u0b9f\u0b9a\u0bbe\u0bae\u0bbf \u0b85\u0bb5\u0bb0\u0bcd\u0b95\u0bb3\u0bbf\u0ba9\u0bcd \u0baa\u0b99\u0bcd\u0b95\u0bc1 \u0b8e\u0ba9\u0bcd\u0ba9?",
]
documents = [
    'மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர்\t: \tமயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர்\t:\tமயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர்\t:\tபேரா. வீ. அரசு பதிப்பாளர்\t:\tமுனைவர் இ. இனியன் பதிப்பு\t:\t2014 தாள்\t:\t16கி வெள்ளைத்தாள் அளவு\t:\t தெம்மி எழுத்து\t:\t11 புள்ளி பக்கம்\t:\t336 நூல் கட்டமைப்பு\t:\tஇயல்பு (சாதாரணம்) விலை\t:\tஉருபா. 315/- படிகள்\t:\t1000 மேலட்டை\t:\tகவி பாஸ்கர் நூலாக்கம்\t:\tவி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர்\t:\tஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு\t:\tஇளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : \tதமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும்.  தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்றிய காலம்.  தமிழ்மறுமலர்ச்சி வரலாற்றில் ஓர் எல்லைக் கல். இக்காலச் சூழலில்தான் தமிழையும், தமிழினத்தையும் உயிராக வும் மூச்சாகவும் கொண்ட அருந்தமிழ் அறிஞர்களும், தலைவர்களும் தோன்றி மொழிக்கும், இனத்திற்கும் பெரும் பங்காற்றினர். இப் பொற்காலத்தில்தான் அறிஞர் மயிலை சீனி. வேங்கடசாமி அவர்கள் 6.12.1900இல் தோன்றி 8.5.1980இல் மறைந்தார்.  வாழ்ந்த காலம் 80 ஆண்டுகள்.  திருமணம் செய்யாமல் துறவு வாழ்க்கை மேற்கொண்டு தமிழ் முனிவராக வாழ்ந்து அரை நூற்றாண்டுக்கு மேல் அரிய தமிழ்ப் பணி செய்து மறைந்தவர்.  தமிழ்கூறும் நல்லுலகம் வணங்கத்தக்கவர். இவர் எழுதிய நூல்கள் அனைத்தும் தமிழினம் தன்னை உணர்வதற்கும், தலைநிமிர்வதற்கும், ஆய்வாளர்கள் ஆய்வுப் பணியில் மேலாய்வை மேற்கொள்வதற்கும் வழிகாட்டுவனவாகும்.  ஆய்வுநோக்கில் விரிந்த பார்வையுடன் தமிழுக்கு அழியாத அறிவுச் செல்வங்களை வைப்பாக வைத்துச் சென்றவர்.  தமிழ் - தமிழரின் அடையாளங்களை மீட்டெடுத்துத்தந்த தொல்தமிழ் அறிஞர்களின் வரிசையில் குறிப்பிடத்தக்கவர்.  தமிழ்மண்ணில் 1937-1938இல் நடந்த முதல் இந்தி எதிர்ப்புப் போரை முன்னெடுத்துச்சென்ற தலைவர்கள், அறிஞர்கள் வரிசையில் இவரும் ஒருவர். வரலாறு, இலக்கியம், கலை, சமயம் தொடர்பான ஆய்வு நூல்களையும், பொதுநலன் தொடர்பான நூல்களையும், பன்முகப் பார்வையுடன் எழுதியவர். பேராசிரியர் முனைவர் வீ. அரசு அவர்கள் எழுதிய சாகித்திய அகாதெமி வெளியிட்டுள்ள ‘இந்திய இலக்கியச் சிற்பிகள்’  நூல்வரிசையில் மயிலை சீனி. வேங்கடசாமி பற்றிய வரலாற்று நூலில் ஆவணப்பணி, வரலாறு எழுது பணி, கலை வரலாறு, கருத்து நிலை ஆகிய பொருள்களில் இவர்தம் நுண்மாண் நுழைபுல அறிவினை மிக ஆழமாகப் பதிவுசெய்துள்ளார். ‘முறையான தமிழ் இலக்கிய வரலாற்றை இனி எழுதுவதற்கு எதிர்கால ஆய்வாளர்களுக்கு வழிகாட்டிச் சென்றவர்’ - என்பார் கா. சுப்பிரமணியபிள்ளை அவர்கள். ‘மயிலை சீனி. வேங்கடசாமி ஆண்டில் இளையவராக இருந்தாலும், ஆராய்ச்சித் துறையில் முதியவர், நல்லொழுக்கம் வாய்ந்தவர். நல்லோர் கூட்டுறவைப் பொன்னே போல் போற்றியவர்.’ என்று சுவாமி விபுலானந்த அடிகளார் அவர்களும், “எண்பதாண்டு வாழ்ந்து, தனிப் பெரும் துறவுபூண்டு, பிறர் புகாத ஆய்வுச்சூழலில் புகுந்து தமிழ் வளர்த்த, உலகச் சமயங்களையும், கல்வெட்டு காட்டும் வரலாறுகளையும், சிற்பம் உணர்த்தும் கலைகளையும் தோய்ந்து ஆய்ந்து தோலா நூல்கள் எழுதிய ஆராய்ச்சி அறிஞர் மயிலை சீனி. வேங்கடசாமி அவர்கட்குத் தமிழ்ப் பேரவைச் செம்மல் என்ற பட்டத்தினை வழங்கியும், தமிழ்ச் செம்மல்கள் பேரவையின் ஓர் உறுப்பினராக ஏற்றுக்கொண்டும், மதுரைக் காமராசர் பல்கலைக்கழகம் பாராட்டிச் சிறப்பிக்கிறது” என்று  இப் பெருந்தமிழ் அறிஞரை அப்பல்கலைக் கழகம் போற்றியுள்ளதை மனத்தில் கொண்டு இவரின் அனைத்துப் படைப்புகளையும் வெளியிடுவதில் பெருமை கொள்கிறோம். சென்னைப் பல்கலைக்கழக தமிழ் இலக்கியத்துறைத் தலைவர் வீ. அரசு அவர்கள் - போற்றுதலுக்கும், புகழுக்கும் உரிய இவ்வாராய்ச்சிப் பேரறிஞரின் நூல்கள் அனைத்தையும் பொருள்வழிப் பிரித்து,  எங்களுக்குக் கொடுத்து உதவியதுடன், பதிப்பாசிரியராக இருந்தும், வழிகாட்டியும், இவ்வாராய்ச்சித் தொகுதிகளை ஆய்வாளர்களும், தமிழ் உணர்வாளர்களும் சிறந்த பயன்பெறும் நோக்கில் வெளியிடுவதற்கு பல்லாற்றானும் உதவினார்.   அவருக்கு எம் நன்றி.  இவ்வருந்தமிழ்ச் செல்வங்களை அனைவரும் வாங்கிப் பயனடைய வேண்டுகிறோம். இவ்வாராய்ச்சி நூல்கள் எல்லா வகையிலும் சிறப்போடு வெளி வருவதற்கு உதவிய அனைவர்க்கும் நன்றி. - பதிப்பாளர் தமிழ் ஆவணங்கள் : மறைந்துபோன தமிழ் நூல்கள் பத்தொன்பதாம் நூற்றாண்டின் இறுதிக்காலத்தில் பழைய தமிழ் நூல்கள் அச்சு வடிவம் பெறத்தொடங்கியது. இந்நூல்களில் காணப்படும் பல்வேறு தகவல்கள் புதியனவாக அமைந்திருப்பதைக் காண்கிறோம். மேலும் தமிழில் உருவான நூல்கள் பல பெயரளவில் மட்டும் பதிவாகி யிருப்பதையும் காணமுடிந்தது. இவ்வகைப் பதிவுகளைக் கண்ட மயிலை சீனி.வேங்கடசாமி அவர்கள் அவற்றைத் தொகுத்து உருவாக்கியதே மறைந்துபோன தமிழ்நூல்கள் எனும் இத்தொகுதியாகும். யாப்பருங்கல விருத்தி உரையில் பல நூல்களின் பெயர்கள் இடம்பெற்றுள்ளன. ஆனால் அந்நூல்கள் புழக்கத்தில் இல்லை. அதைப்போலவே யாப்பருங்கலக் காரிகை போன்ற நூல்களுக்கு உரை எழுதிய உரையாசிரியர்கள் பல்வேறு நூல்களின் பெயர்களைக் குறிப்பிடுகிறார்கள். சிலப்பதிகாரத்திற்கு உரையெழுதிய அடியார்க்கு நல்லார் பல நூல்களைக் குறிப்படுகிறார். அவை புழக்கத்தில் இல்லை. இவ்வகையில் காணப்படும் 333 நூல்களின் பட்டியலை இந்நூலில் மயிலை சீனி. வேங்கடசாமி குறிப்பிடுகிறார். அகப்பொருள், புறப்பொருள் ஆகியவற்றை உள்ளடக்கிய இலக்கிய நூல்கள் 87, காவியம் மற்றும் பிற இலக்கிய வடிவங்களில் அமைந்த நூல்கள் 96, இசைத் தமிழ் நூல்கள் 13, நாடகத் தமிழ் நூல்கள் 22, இலக்கண நூல்கள் 107 ஆகியவை இந்நூலில் இடம் பெற்றுள்ளன. வாய்மொழி மரபிலோ அல்லது சுவடியாகவோ இருந்த இந்நூல்கள் அழிந்துவிட்டன. ஆனால் அந்நூற்செய்திகளைப் பிற்கால நூலாசிரியர்களும் உரையாசிரியர்களும் எடுத்துப் பயன்படுத்தி யுள்ளனர். சுமார் இரண்டாயிரத்து ஐந்நூறு ஆண்டுகள் பழமையுள்ள தமிழ்மொழி மற்றும் இலக்கிய மரபில் இவ்வகையான நிகழ்வு சாத்தியமே. ஆனால் மறைந்து போனவற்றில் எஞ்சியுள்ளவற்றை பதிவு செய்வது அவசியம். அப்பணியை மயிலை சீனி.வேங்கடசாமி அவர்கள் சிறப்பாகச் செய்துள்ளார். இத்தொகுப்புகள் உருவாக்கத்தில் தொடக்க காலத்தில் உதவிய ஆய்வாளர்கள் மா. அபிராமி, ப. சரவணன் ஆகியோருக்கும் இத்தொகுதிகள் அச்சாகும் போது பிழைத்திருத்தம் செய்து உதவிய ஆய்வாளர்கள் வி. தேவேந்திரன், நா. கண்ணதாசன் ஆகியோருக்கும் நன்றி. சென்னை - 96\tதங்கள் ஏப்ரல் 2010\tவீ. அரசு தமிழ்ப்பேராசிரியர் தமிழ் இலக்கியத்துறை சென்னைப் பல்கலைக்கழகம் அறிஞர் மயிலை சீனி. வேங்கடசாமி',
    'சிறங்கணித் திரங்கிச் செல்வான்.” பர்வதன் என்னும் பிராமணன் காட்டு வழியாகச் சென்றபோது, மகா காளன் என்பவன் வயோதிகப் பிராமண வடிவம் கொண்டு எதிர்ப்பட்ட காட்சியைக் கூறுகிறது இச்செய்யுள். “அலைவட்டங் கிடந்த வல்குற் கதிபதி யாகும் பெற்றி கலைவட்டங் கிடந்த வல்குற் காரிகைக் கறிவித் தாயேல் முலைவட்டங் கிடந்த முத்த மாலைமென் முறுவ லாளென் சிலைவட்டங் கிடந்த தோளைச் செறிதற்கையுறவு முண்டோ” சீதையை வசப்படுத்தச் சென்ற சூர்ப்பனகை தன் முயற்சி கை கூடாமல் திரும்பிவந்து இராவணனிடம் சீதையின் கற்பின் உறுதியைக் கூறியபோது, இராவணன் அவளைச் சினந்து கூறியது இச்செய்யுள். “தொடர்த்தொடர்ப் படுவ தொக்கும் தொட்டிற் சுருக்கி மெய்யைக் கடக்கப்பாய்ந் திட இளைத்துக் கறுகினைக் கறித்துக் காதல் வடிக்கண்ணார் போல நோக்கும் ... .. ... .. ... .. ... .. ... .. ... அடுத்தடுத் தணுகும் நீங்கும் அணியது போன்று சேய்த்தாம்.” மாரீசன், மானுருவங் கொண்டு இராமனிடம் அகப்படாமல் அவனைத் தூரத்தில் அழைத்துச் சென்றதைக் கூறுகிறது. சிதைந்து போன இந்தச் செய்யுள். “உருமிடப் புண்ட வருமணி நாகமெனத் திருமணி நிலத்திற் றேவி சோர்ந்து செய்த பாவையின் மெய்திரி வின்றி மையலி னுயிர்த்து மடிந்துடன் கிடப்ப.” சீதாலக்ஷ்மியை இராவணன் அசோக வனத்தில் வைத்த பிறகு தனது உருவத்தைச் சீதைக்குக் காட்டியபோது அவள் சோர்ந்து மூர்ச்சை யடைந்த செய்தியைக் கூறுவது, இவ்வகவற்பா செய்யுட் பகுதி. “அறிவுற்றங் கெழுந்த பாவை யமருல கத்துச் சென்று பிறவிபெற் றவரைப் போல யாவிர்நீ ரிதுவென் என்ன அறிவித்தார் யாங்கள் விச்சா தரியரீ திலங்கை என்ன மறியத்தான் மயங்கி வீழ்ந்தாள் வழுத்தரு வாளை யொத்தாள்.” மூர்ச்சை தெளிந்து எழுந்த சீதாலக்ஷ்மி தன் அருகிலிருந்த பணிப் பெண்களை ‘நீவிர் யார், இது எந்த ஊர்’ என்று கேட்டபோது, அவர்கள் இது இலங்கை, நாங்கள் விச்சாதரப் பெண்கள் என்று கூறக் கேட்டு, மீண்டும் மூர்ச்சை யடைந்ததைக் கூறுகிறது. இச்செய்யுள். “விம்முறு துயரிற் கொம்மென உயிரா விளைந்த தெல்லாம் உளங்கொள வுணரா எழுதுகண் ணருவி யினைந்தினைந் திரங்கலின் ஒழுகுபு பொழிய முழுகிய மேனியள் அழுதழு தலறி ஆ!ஓ! என்னும்; இணைபிரி யன்றிலின் ஏங்கி நீங்காத் துணைவனை நினைந்து சோகமீ தூர்தர வான்பழி சுமந்துநின் வளமலர்ச் சேவடி யான்பிரிந் தேதில னிடவயி னிடர்ப்பட மான்பின் ஏகிய மன்னவ னேயெனும்; மாயோன் செய்த மாய மானிடை மாயவன் செய்த மகிழ்ச்சிகண் டருளி ஆவதொன் றின்றி அதன்வழி யொழுகிய நாயக னேயெனை நணுகாய் வந்தெனும்; கொற்றவன் றுணையே குலவிளங் களிறே செற்றவர் செகுக்குஞ் சினத்தீ யுருமே மைத்துன மலையே மன்னவ னேயெனும்; நாற்கடற் பரந்தன வேற்படைத் தானையொடு கூற்றம் மொய்ம்பிற் கொடுஞ்சிலைத் தடக்கைத் தம்பித் துணைவனிற் றனிப்படப் பிரித்திட் டெம்பெரு மானை யென்வயி னிறுவி மற்றவன் செய்த மாய மானினை நோற்றி லாதேன் நோக்கிய நோக்கின் அருவினை யேனை அருளிய மனத்தால் மருவிய மாய வுருவுதாற் கெழுந்த வரிசிலைக் குரிசிலை மன்னர்பெரு மானை மான்மறி தொடர்ந்துசெல் வாளரி போலக் கானெறி விடுத்துக் கடுவனம் புகுத்தி மாயப் புணர்ப்பின் மன்ன வனைநினைந் தாயமுந் தாயருந் தோழியு மின்றியோர் நொதும லாளன் விதிவழி யொழுகி இடனிடை யிட்ட சேய்மைத் தன்றியுங் கடலிடை யிட்ட காப்பிற் றாகிய இலங்கை மூதூ ரிடுசிறைப் பட்டு மலங்கு விழிமான் வழிதொடர்ந் தருளிய மன்னவற் குற்றதும் இன்னதென் றறியா தின்னற் படவெனை இன்னண மிழைத்த வினையே வலிதே விளிதரல் புரிவாய் மனுவே யனையானை வார ணாசியில் தனியொரு மான்மறி தன்பின் விடுத்தே எனையுத் தனியே இவணிட் டதுவே.” “சுழல்விழித் தறுகண்வேழத் தடக்கைபோற்றிரண்ட தோளாய் உழைவிழி யார்சொற்கொண்டா ருறுவர்வெந் துயரமென்னும் பழமொழி யதனை யோர்ந்தும் பாவியேன் சொல்லைக் கேளா உழையின்பின் போன வேந்தே உனக்குற்ற தறிகி லேனே.” “அடலருந் திறலி னாயை வஞ்சித்திட் டஞ்ச வன்னப் பெடையுறு நடையி னாரிற் பெரியபா வஞ்செய் தேனைக் குடிலவாள் அவுணன் கொண்டு போயினா னென்ன ஒன்னா ருடைபுறங் காணல் நாணும் வீரனீ யுறுவ தென்னோ!” “எனவும் பலவும் புலம்பினள் புலம்பாக் கோம்பி கண்டு குலுங்குபு கலங்காச் சாம்பிய மஞ்ஞையிற் சாய்ந்தனள் கிடப்ப வித்யாதரிகள் விரும்பினர் சூழ்ந்து.” அசோகவனத்திலே சீதாலக்ஷ்மி தனது விதியை நினைத்தும், இராமனது நிலையை எண்ணியும் வருந்தியதைக் கூறுகின்றன இச்செய்யுள்கள். 3. சங்ககாலத்துப் பாரதம் மதுரைத் தமிழ்ச் சங்கத்திலே மகாபாரதத்தைத் தமிழில் மொழி பெயர்த்து எழுதியதாகச் சின்னமனூர்ச் செப்பேட்டுச் சாசனம் கூறுகிறது. இந்தப் பாண்டிய சாசனம் சின்னமனூரில் கிடைத்தபடியால், சின்ன மனூர்ச் சாசனம் எனப்படுகிறது. சின்னமனூர் என்பது மதுரை மாவட்டம், பெரியகுளம் தாலுகாவில் உள்ளது. இவ்வூர் பெருமாள் கோவிலில் மடைப் பள்ளி கட்டுவதற்காக, சுமார் 50 ஆண்டுகளுக்கு முன் நிலத்தைத் தோண்டிய போது, இந்தச் செப்பேட்டுச் சாசனங்கள் கிடைத்தன. இவை பெரிய செப்பேடு, சின்ன செப்பேடு என இருவகைப்படும். இந்தச் சாசனங்கள் இப்போது சென்னை அரசாங்கக் காட்சிசாலையில் உள்ளன. இச்சாசனங்கள் தமிழ் மொழியிலும் வடமொழியிலும் எழுதப்பட்டுள்ளன. சின்னமனூர் பெரிய செப்பேட்டின் தமிழ்ப் பகுதியில், பழைய பாண்டியரைப் பற்றிக் கூறும் பகுதியில், பாண்டியர் தமிழ்ச் சங்கம் வைத்தலும், அச்சங்கத்தில் மகாபாரதத்தைத் தமிழில் எழுதியதும் ஆகிய செய்தியும் கூறப் படுகிறது. அந்தப் பகுதி வருமாறு: “... ... ... ... பாக ஸாஸநனாரம் வவ்வியும் செம்மணிப் பூணொடு தோன்றித் தென்றமிழின் கரைகண்டும் வெம்முனை வேலொன்று விட்டும் விரைவரவிற் கடல்மீட்டும் பூழியனெனப் பெயரெய்தியும் போர்க்குன்றாயிரம்மிசியும் பாழியம் பாயலி னிமிர்ந்தும் பஞ்சவ னென்னும் பெயர்நிறீயும் வளமதுரை நகர் கண்டும் மற்றதற்கு மதிள் வகுத்தும் உளமிக்க மதி அதனா லொண்டமிழும் வடமொழியும் பழுதறத்தா னாராய்ந்து பண்டிதரில் மேந்தோன்றியும் மாரதர் தலைகளத் தவியப் பாரதத்திற் பகடோட்டியும் விஜயனை வசு சாப நீக்கியும் வந்தழியச் சுரம் போக்கியும் வசையில் மாக்கயல் புலிசிலை வடவரை நெற்றியில் வரைந்தும் தடம்பூதம் பணிகொண்டு தடாகங்கள் பல திருத்தி யும் அடும்பசிநோய் நாடகற்றி அம்பொற்சித்ர முயரியும் தலையாலங் கானத்திற் றன்னொக்க விருவேந்தரைக் கொலைவாளிற் றலைதுமித்துக் குறைத் தலையின் கூத்தொழித்தும் மஹாபாரதந் தமிழ்ப்படுத்தும் மதுராபுரிச் சங்கம் வைத்தும் மஹாராஜரும் ஸார்வபௌமரும் தம் மகிமண்டலங் காத்திகந்த பின், வில்லவனை நெல்வேலியும் விரிபொழிற் சங்கமங்கைப் பல்லவனையும் புறங்கண்ட பராங்குசப் பஞ்சவர் தோன்றலும் ... ... ... ... ...”1',
    'வெம்முரட் செல்வன் கதிரு மூழ்த்தனன் சேந்தனை சென்மோ பூந்தார் மார்ப இளையள் மெல்லியள் மடந்தை யரிய சேய பெருங்கல் லாறே.\t7 இந்தச் செய்யுள்களை நச்சினார்க்கினியரும் (தொல். பொருள். 40ஆம் சூ.) இளம்பூரணரும் (தொல். பொருள். அகத்திணை, 43ஆம் சூ.), இறையனாரகப்பொருளுரையாசியரும் (23ஆம் சூ.) மேற்கோள் காட்டியுள்ளார்கள். கீழ்க்காணும் செய்யுள்களும் சிற்றெட்டகச் செய்யுள்களென்று கருதப்படுகின்றன: உள்ளார் கொல்லோ தோழி சிள்ளெனப் பருந்துவீழ்ந் தெடுத்த பைந்தலை யரவங் காதறு கவண தேய்க்குந் தீதுறு கள்ளியங் காடிறந் தோரே.\t8 உள்ளார் கொல்லோ தோழி முள்ளுடை யலங்குகுலை யீந்தின் சிலம்பிபொதி செங்காய் துகில்பொதி பவள மேய்க்கு மகில்படு கள்ளியங் காடிறந் தோரே.\t9 இச்செய்யுள்களை நச்சினார்க்கினியரும் (தொல். சொல். 288ஆம் சூ.), யாப்பருங்கல விருத்தியுரைகாரரும் (19ஆம் சூ.), யா. காரிகை உரையாசிரியரும் (11ஆம் சூ.) மேற்கோள் காட்டியுள்ளனர். உள்ளார் கொல்லோ தோழி முள்ளுடை யிலவ மேறிய கலவ மஞ்ஞை யெரிபுகு மகளி ரேய்க்கு மரில்படு கள்ளியங் காடிறந் தோரே.\t10 உள்ளார் கொல்லோ தோழி வெள்ளைப் புழுங்க னெல்லின் பொரிவீழ்த் தென்ன நுண்குழிப் புற்றின் மண்கா லீயல் கோல்பிடி குருட ரேய்க்கு மாலுறு கள்ளியங் காடிறந் தோரே.\t11 அடும்பம னெடுங்கொடி யுள்புதைந் தொளிப்ப வெண்மணல் விரிக்குந் தண்ணந் துறைவன் கொடிய னாயிறு மாக வவனே தோழியென் னுயிர்கா வலனே.\t12 இச்செய்யுள்களை நச்சினார்க்கினியர் (தொல். பொருள். 111ஆம் சூ.), மேற்கோள் காட்டியுள்ளார். நாற்கவிராச நம்பி இயற்றிய அகப்பொருள் விளக்கம் ஒழிபியலில் (42ஆம் சூத்திரம்) கீழ்க்காணும் சிற்றெட்டகச் செய்யுள்கள் மேற்கோள் காட்டப்பட்டுள்ளன: “உரைத்திசிற் றோழியது புரைத்தோ வன்றே துருக்கங் கமழு மென்றோள் துறப்ப வென்றி யிரீஇயரென் னுயிரே4\t13 என்னுஞ் சிற்றெட்டகத்துக் குறிஞ்சிப்பாட்டினுள் ஊடல் என்னும் உரிப்பொருள் கண்டுகொள்க.” தொல். பொருள். அகத்திணையியல் 24ஆம் சூத்திர உரையில் இளம்பூரண அடிகள் மேற்கோள் காட்டியுள்ளார். “நாளு நாளு மாள்வினை யழுங்க வில்லிலிருந்து மகிழ்வோற் கில்லையாற் புகழென வொண்பொருட் ககல்வர்நங் காதலர் கண்பனி துடையினித் தோழி நீயே5\t14. என்பது இருத்தலென்னும் உரிப்பொருள் சிற்றெட்டகத்துப் பாலைப் பாட்டினுள் வந்தது.” இந்தச் செய்யுளை இளம்பூரணர் (தொல். பொருள். அகத்திணை. 42ஆம் சூத்திர உரையில்) மேற்கோள் காட்டியுள்ளார். “சுறவுப்பிற ழிருங்கழி நீந்தி யல்கலு மிரவுக்குறிக் கொண்கன் வந்தனன் விரவுமணிக் கொடும்பூண் விளங்கிழை யோயே\t15 என்பது புணர்தல் என்னும் உரிப்பொருள் வந்த சிற்றெட்டகத்து நெய்தற் பாட்டு.” இச்செய்யுளை இளம்பூராண அடிகள் (தெல். பொருள். அகத்திணை. 24ஆம் சூத்திர உரையில்) மேற்கோள் காட்டுகிறார். 19. தமிழ் முத்தரையர் கோவை இப்பெயரையுடைய ஒரு நூல் இருந்ததென்பது, தண்டியலங்கார உரையாசிரியர், யாப்பருங்கல விருத்தியுரைகாரர் ஆகிய இருவரும் கூறுவதிலிருந்து தெரிகிறது. தண்டியலங்காரம், பொதுவணியியல் 7ஆம் சூத்திர உரையில், அதன் உரையாசிரியர், ‘கோவை என்பன தமிழ் முத்தரையர் கோவை முதலாயின’ என்று கூறுகிறார். யாப்பருங்கலம் ஒழிபியலில், அதன் விருத்தியுரைகாரர் இந்நூலைக் குறிப்பிடுகிறார். அவர் கூறுவது இது: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாப்பருங்கலக் காரிகையும்போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின், ஓரடி பதினேழெழுத்தாம். முதற்கண் நேரசை வரின் ஓரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா, அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழித்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் செய்யுளை உதாரணங் காட்டுகிறார்: “காய்ந்துவிண் டார்நையக் காமரு கூடலிற் கண்சிவந்த வேந்துகண் டாயென்ன வெள்வளை சோரக் கலைநெகிழப் போந்துகண் டாரொடும் போந்துகண் டேற்கவன் பொன்முடிமேற் போந்துகண் டாளென்று போந்ததென் மாட்டோர் புறனுரையே.” இதே செய்யுளை யாப்பருங்கலம், தொடையோத்து 53ஆம் சூத்திர உரையிலும் மேற்கோள் காட்டுகிறார். இச்செய்யுள் இன்ன நூலைச் சேர்ந்தது என்பதை இவர் குறிப்பிட வில்லையாயினும், இது தமிழ் முத்தரையர் கோவையைச் சேர்ந்த செய்யுள் என்று கருதப்படுகிறது. தமிழ் முத்தரையர் கோவை இப்போது கிடைக்கவில்லை யாகையினால், இது மறைந்துபோன தமிழ் நூல்களிலே ஒன்றாகும். இதைப்பற்றி வேறு செய்திகள் தெரியவில்லை. 20. திருவதிகைக் கலம்பகம் இந்தக் கலம்பகம், திருவதிகை வீரட்டானேசுவரர் பேரில் பாடப் பட்டது. திருவதிகை, தென்ஆர்க்காடுமாவட்டம், கூடலுர்த் தாலுகாவில் உள்ளது. திருவதிகைக் கோவிலில் உள்ள கல்வெட்டுச் சாசனம் ஒன்று இந்நூலையும் இந்நூலாசிரியரையும் கூறுகிறது. இந்தச் சாசனம் சக ஆண்டு 1458, துன்முகி, ஆடி 10ஆம் நாள் எழுதப்பட்டது. அதாவது, கி.பி. 1536இல் இது எழுதப்பட்டது. உத்தர மேரூரில் மகிபால குலசேரி என்னும் தெருவில் வாழ்ந்துவந்த உத்தண்டவேலாயுத பாரதி என்பவர் இந்நூலை இயற்றினார் என்று இச்சாசனம் கூறுகிறது. தொண்டை மண்டலத்துக் காலியூர்க் கோட்டத்து ராஜேந்திரசோழ சதுர்வேதி மங்கலம் என்னும் உத்தரமேரூர் என்று இந்தச் சாசனம் இவர் ஊரைக் கூறுகிறது. மேலும், கௌண்டன்ய கோத்திரத்து ஆபஸ்தம்ப சூத்திரத்து வீரவல்லி தேவராச பட்டர் காசிநாத குப்பையன் என்னும் உத்தண்ட வேலாயுத பாரதி என்றும் இவர் பெயரைக் கூறுகிறது. இந்தக் கலம்பகம் பாடியதற்காக 2 மா நன்செய் நிலமும், 1மா புன் செய் நிலமும், திருவதிகை நகரத்துக் கோட்டைக்குள் இருந்த அக்கிர காரத்தில் ஒரு வீடும் இந்தப் புலவருக்குத்தானம் செய்யப்பட்டன.  (376 of 1921., Annual Report of Epigraphy, Madras, 1922, page 99.) 21. திருமறைக் காட்டந்தாதி இந்த அந்தாதியைப் பாடியவர், கி.பி. 9ஆம் நூற்றாண்டில் இருந்தவரும், சுந்தரமூர்த்தி நாயனாரின் நண்பருமான சேரமான் பெருமாள் நாயனார். இவருக்குக் கழறிற்றறிவார் என்னும் பெயரும் உண்டு. சேரமான் பெருமாளும் சுந்தரமூர்த்தி நாயனாரும் திருமறைக் காட்டுக்குச் சென்றார்கள். சுந்தரர் பதிகம் பாடினார். சேரமான் பெருமாள் நாயனார், திருமறைக்காட்டந்தாதியைப் பாடி அங்கு அரங்கேற்றினார். இச்செய்தியைத் திருத்தொண்டர் புராணம் என்னும் பெரியபுராணம் கூறுகிறது: நிறைந்த மறைகள் அருச்சித்த நீடு மறைக்காட் டருமணியை இறைஞ்சி வீழ்ந்து பணிந்தெழுந்து போற்றி யாழைப் பழித்தென்னும் அறைந்த பதிகத் தமிழ்மாலை நம்பி சாத்த அருட்சேரர் சிறந்த அந்தா தியிற்சிறப்பித் தனவே யோதித் திளைத்தெழுந்தார்.',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 768] [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.9104, 0.6307, 0.8431]])

Training Details

Training Dataset

Unnamed Dataset

  • Size: 1,200 training samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 17 tokens
    • mean: 36.92 tokens
    • max: 79 tokens
    • min: 1592 tokens
    • mean: 1790.37 tokens
    • max: 1966 tokens
    • min: 1260 tokens
    • mean: 1786.25 tokens
    • max: 1966 tokens
  • Samples:
    anchor positive negative
    மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... வணிகர்க் கெழுபது மற்றவை யோர்க்குத் துணியிலறு பத்தைஞ்சு சொல்லும்.” 2 (நவநீதம்-34-ஆம் செய்யுளுரை மேற்கோள்). “சந்தத் தொருபது பல்சந்த மாலை, அந்த வெள்ளை யைம்பதா னெழுபதா னென்கவூர்ப் பேரோடுறுமா வியல்பே அகவற் றனையும் அவ்வழி வரையார்.” 2அ (நவநீதம்-37-ஆம் செய்யுளுரை மேற்கோள்). “உரைத்த தசாங்க மாவன பத்தாக நிரைத்து வருவது நேரிசை வெண்பா; செங்கோல் அமரரை வேந்தரைச் செப்புதல் சின்னப் பூவாம்.” 3 “ஏனையோர்க்குத் தசாங்கம் அல்லா தனவென்ப இயல்புணர்ந் தோரே.” 4 (நவநீதம்-39-ஆம் செய்யுளுரை மேற்கோள்). “பேணுதகு சிறப்பிற் பெண்மக வாயின் மூன்றா மாண்டின் மொழிகுவ குழமகன்.” 5 (நவநீதம்-44-ஆம் செய்யுளுரை மேற்கோள்). “ஓதலும் பாடலு மூசலும் பிறவும் பதினெண் தேசத்துப் பலபல பேச்சின விறலும் அனைவர்க்கு முரித்தே ஆயுங் காலை.” 6 “மங்கை முதலா மாற்றவரும் ஆணுடை யுடுத்தலும் ஆடகம் புனையலும் அம்மனை கழங்கே ஊசல் பந்தொடு சூது பொருதலுங் காளையிற் பிரிதலும் பல்லோ ராயத்திலு மக்களுண வாக அனையவை பிறவுமவர்க் குரிய வென்ப.” 7 (நவநீதம்-45-ஆம் செய்யுளுரை மேற்கோள்). “அறம்பொருள் வீடெனு மூன்றையும் பழித்துக் காமமே பொருளா அரிவை யருள்பெற வேட்கையி னான்மட லூர்வனென்...
    மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... இப்பெயரையுடைய ஒரு நூல் இருந்தது என்பது யாப்பருங்கல விருத்தியினால் தெரிகிறது. குமாரசேனாசிரியர் என்னும் புலவரால் இயற்றப்பட்டதாகலின் இப்பெயர் பெற்றது. போலும். யாப்பருங்கல விருத்தியுரைகாரர் இந்நூலைப் பற்றி இவ்வாறு குறிப்பிடுகிறார்: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாருப்பருங்கலக் காரிகையும் போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின் ஒரடி பதினேனெழுத்தாம். முதற்கண் நேரசை வரின் ஒரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா. அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழிந்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் கலித் துறைச் செய்யுளை உதாரணமாக மேற்கொள் காட்டுகிறார்: “இருநெடுஞ் செஞ்சுட ரெஃகமொன் றேந்தி யிரவின்வந்த வருநெடுங் காதற்கன் றேதரற் பாலதல் லாதுவிட்டால் கருநெடு மால்கட லேந்திய கோன்கயல் சூடுநெற்றிப் பெருநெடுங் குன்றம் விலையோ கருதிலெம் பெண்கொடிக்கே.” இந்தச் செய்யுளை இவ்வுரையாசிரியர், யாப்பருகலம், சீரோத்து 15ஆம் சூத்திர உரையிலும், ஒழிபியலில் இரண்டிடங்களிலும் மேற்கோள் காட்டியிருக்...
    மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... இப்பெயரையுடைய ஒரு நூல் இருந்தது என்பது யாப்பருங்கல விருத்தியினால் தெரிகிறது. குமாரசேனாசிரியர் என்னும் புலவரால் இயற்றப்பட்டதாகலின் இப்பெயர் பெற்றது. போலும். யாப்பருங்கல விருத்தியுரைகாரர் இந்நூலைப் பற்றி இவ்வாறு குறிப்பிடுகிறார்: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாருப்பருங்கலக் காரிகையும் போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின் ஒரடி பதினேனெழுத்தாம். முதற்கண் நேரசை வரின் ஒரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா. அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழிந்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் கலித் துறைச் செய்யுளை உதாரணமாக மேற்கொள் காட்டுகிறார்: “இருநெடுஞ் செஞ்சுட ரெஃகமொன் றேந்தி யிரவின்வந்த வருநெடுங் காதற்கன் றேதரற் பாலதல் லாதுவிட்டால் கருநெடு மால்கட லேந்திய கோன்கயல் சூடுநெற்றிப் பெருநெடுங் குன்றம் விலையோ கருதிலெம் பெண்கொடிக்கே.” இந்தச் செய்யுளை இவ்வுரையாசிரியர், யாப்பருகலம், சீரோத்து 15ஆம் சூத்திர உரையிலும், ஒழிபியலில் இரண்டிடங்களிலும் மேற்கோள் காட்டியிருக்...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 1
  • learning_rate: 2e-05
  • num_train_epochs: 5
  • warmup_ratio: 0.1

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 1
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss
1.0 1200 1.1621
2.0 2400 1.1903
3.0 3600 0.8968
4.0 4800 0.7064
5.0 6000 0.6286

Framework Versions

  • Python: 3.13.3
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.1.1
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
12
Safetensors
Model size
0.3B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for tamiltheorist/tamil_embedding

Finetuned
(202)
this model

Papers for tamiltheorist/tamil_embedding