Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
12
This is a sentence-transformers model finetuned from google/embeddinggemma-300m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(4): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("tamiltheorist/tamil_embedding")
# Run inference
queries = [
"\u0ba4\u0bae\u0bbf\u0bb4\u0bcd \u0bae\u0bca\u0bb4\u0bbf\u0b95\u0bcd\u0b95\u0bc1 \u0027\u0baa\u0bca\u0bb1\u0bcd\u0b95\u0bbe\u0bb2\u0bae\u0bcd\u0027 \u0b8e\u0ba9\u0bcd\u0bb1\u0bc1 \u0bb5\u0bbf\u0bb5\u0bb0\u0bbf\u0b95\u0bcd\u0b95\u0baa\u0bcd\u0baa\u0b9f\u0bc1\u0bae\u0bcd \u0bb5\u0bb0\u0bb2\u0bbe\u0bb1\u0bcd\u0bb1\u0bc1 \u0b95\u0bbe\u0bb2\u0b95\u0b9f\u0bcd\u0b9f\u0bae\u0bcd \u0b8e\u0ba4\u0bc1, \u0bae\u0bc7\u0bb2\u0bc1\u0bae\u0bcd \u0b85\u0ba8\u0bcd\u0ba4\u0b95\u0bcd \u0b95\u0bbe\u0bb2\u0b95\u0b9f\u0bcd\u0b9f\u0ba4\u0bcd\u0ba4\u0bbf\u0bb2\u0bcd \u0ba8\u0b9f\u0ba8\u0bcd\u0ba4 \u0bae\u0bc1\u0ba4\u0bb2\u0bcd \u0b87\u0ba8\u0bcd\u0ba4\u0bbf \u0b8e\u0ba4\u0bbf\u0bb0\u0bcd\u0baa\u0bcd\u0baa\u0bc1\u0baa\u0bcd \u0baa\u0bcb\u0bb0\u0bbf\u0bb2\u0bcd \u0bae\u0baf\u0bbf\u0bb2\u0bc8 \u0b9a\u0bc0\u0ba9\u0bbf. \u0bb5\u0bc7\u0b99\u0bcd\u0b95\u0b9f\u0b9a\u0bbe\u0bae\u0bbf \u0b85\u0bb5\u0bb0\u0bcd\u0b95\u0bb3\u0bbf\u0ba9\u0bcd \u0baa\u0b99\u0bcd\u0b95\u0bc1 \u0b8e\u0ba9\u0bcd\u0ba9?",
]
documents = [
'மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர்\t: \tமயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர்\t:\tமயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர்\t:\tபேரா. வீ. அரசு பதிப்பாளர்\t:\tமுனைவர் இ. இனியன் பதிப்பு\t:\t2014 தாள்\t:\t16கி வெள்ளைத்தாள் அளவு\t:\t தெம்மி எழுத்து\t:\t11 புள்ளி பக்கம்\t:\t336 நூல் கட்டமைப்பு\t:\tஇயல்பு (சாதாரணம்) விலை\t:\tஉருபா. 315/- படிகள்\t:\t1000 மேலட்டை\t:\tகவி பாஸ்கர் நூலாக்கம்\t:\tவி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர்\t:\tஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு\t:\tஇளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : \tதமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்றிய காலம். தமிழ்மறுமலர்ச்சி வரலாற்றில் ஓர் எல்லைக் கல். இக்காலச் சூழலில்தான் தமிழையும், தமிழினத்தையும் உயிராக வும் மூச்சாகவும் கொண்ட அருந்தமிழ் அறிஞர்களும், தலைவர்களும் தோன்றி மொழிக்கும், இனத்திற்கும் பெரும் பங்காற்றினர். இப் பொற்காலத்தில்தான் அறிஞர் மயிலை சீனி. வேங்கடசாமி அவர்கள் 6.12.1900இல் தோன்றி 8.5.1980இல் மறைந்தார். வாழ்ந்த காலம் 80 ஆண்டுகள். திருமணம் செய்யாமல் துறவு வாழ்க்கை மேற்கொண்டு தமிழ் முனிவராக வாழ்ந்து அரை நூற்றாண்டுக்கு மேல் அரிய தமிழ்ப் பணி செய்து மறைந்தவர். தமிழ்கூறும் நல்லுலகம் வணங்கத்தக்கவர். இவர் எழுதிய நூல்கள் அனைத்தும் தமிழினம் தன்னை உணர்வதற்கும், தலைநிமிர்வதற்கும், ஆய்வாளர்கள் ஆய்வுப் பணியில் மேலாய்வை மேற்கொள்வதற்கும் வழிகாட்டுவனவாகும். ஆய்வுநோக்கில் விரிந்த பார்வையுடன் தமிழுக்கு அழியாத அறிவுச் செல்வங்களை வைப்பாக வைத்துச் சென்றவர். தமிழ் - தமிழரின் அடையாளங்களை மீட்டெடுத்துத்தந்த தொல்தமிழ் அறிஞர்களின் வரிசையில் குறிப்பிடத்தக்கவர். தமிழ்மண்ணில் 1937-1938இல் நடந்த முதல் இந்தி எதிர்ப்புப் போரை முன்னெடுத்துச்சென்ற தலைவர்கள், அறிஞர்கள் வரிசையில் இவரும் ஒருவர். வரலாறு, இலக்கியம், கலை, சமயம் தொடர்பான ஆய்வு நூல்களையும், பொதுநலன் தொடர்பான நூல்களையும், பன்முகப் பார்வையுடன் எழுதியவர். பேராசிரியர் முனைவர் வீ. அரசு அவர்கள் எழுதிய சாகித்திய அகாதெமி வெளியிட்டுள்ள ‘இந்திய இலக்கியச் சிற்பிகள்’ நூல்வரிசையில் மயிலை சீனி. வேங்கடசாமி பற்றிய வரலாற்று நூலில் ஆவணப்பணி, வரலாறு எழுது பணி, கலை வரலாறு, கருத்து நிலை ஆகிய பொருள்களில் இவர்தம் நுண்மாண் நுழைபுல அறிவினை மிக ஆழமாகப் பதிவுசெய்துள்ளார். ‘முறையான தமிழ் இலக்கிய வரலாற்றை இனி எழுதுவதற்கு எதிர்கால ஆய்வாளர்களுக்கு வழிகாட்டிச் சென்றவர்’ - என்பார் கா. சுப்பிரமணியபிள்ளை அவர்கள். ‘மயிலை சீனி. வேங்கடசாமி ஆண்டில் இளையவராக இருந்தாலும், ஆராய்ச்சித் துறையில் முதியவர், நல்லொழுக்கம் வாய்ந்தவர். நல்லோர் கூட்டுறவைப் பொன்னே போல் போற்றியவர்.’ என்று சுவாமி விபுலானந்த அடிகளார் அவர்களும், “எண்பதாண்டு வாழ்ந்து, தனிப் பெரும் துறவுபூண்டு, பிறர் புகாத ஆய்வுச்சூழலில் புகுந்து தமிழ் வளர்த்த, உலகச் சமயங்களையும், கல்வெட்டு காட்டும் வரலாறுகளையும், சிற்பம் உணர்த்தும் கலைகளையும் தோய்ந்து ஆய்ந்து தோலா நூல்கள் எழுதிய ஆராய்ச்சி அறிஞர் மயிலை சீனி. வேங்கடசாமி அவர்கட்குத் தமிழ்ப் பேரவைச் செம்மல் என்ற பட்டத்தினை வழங்கியும், தமிழ்ச் செம்மல்கள் பேரவையின் ஓர் உறுப்பினராக ஏற்றுக்கொண்டும், மதுரைக் காமராசர் பல்கலைக்கழகம் பாராட்டிச் சிறப்பிக்கிறது” என்று இப் பெருந்தமிழ் அறிஞரை அப்பல்கலைக் கழகம் போற்றியுள்ளதை மனத்தில் கொண்டு இவரின் அனைத்துப் படைப்புகளையும் வெளியிடுவதில் பெருமை கொள்கிறோம். சென்னைப் பல்கலைக்கழக தமிழ் இலக்கியத்துறைத் தலைவர் வீ. அரசு அவர்கள் - போற்றுதலுக்கும், புகழுக்கும் உரிய இவ்வாராய்ச்சிப் பேரறிஞரின் நூல்கள் அனைத்தையும் பொருள்வழிப் பிரித்து, எங்களுக்குக் கொடுத்து உதவியதுடன், பதிப்பாசிரியராக இருந்தும், வழிகாட்டியும், இவ்வாராய்ச்சித் தொகுதிகளை ஆய்வாளர்களும், தமிழ் உணர்வாளர்களும் சிறந்த பயன்பெறும் நோக்கில் வெளியிடுவதற்கு பல்லாற்றானும் உதவினார். அவருக்கு எம் நன்றி. இவ்வருந்தமிழ்ச் செல்வங்களை அனைவரும் வாங்கிப் பயனடைய வேண்டுகிறோம். இவ்வாராய்ச்சி நூல்கள் எல்லா வகையிலும் சிறப்போடு வெளி வருவதற்கு உதவிய அனைவர்க்கும் நன்றி. - பதிப்பாளர் தமிழ் ஆவணங்கள் : மறைந்துபோன தமிழ் நூல்கள் பத்தொன்பதாம் நூற்றாண்டின் இறுதிக்காலத்தில் பழைய தமிழ் நூல்கள் அச்சு வடிவம் பெறத்தொடங்கியது. இந்நூல்களில் காணப்படும் பல்வேறு தகவல்கள் புதியனவாக அமைந்திருப்பதைக் காண்கிறோம். மேலும் தமிழில் உருவான நூல்கள் பல பெயரளவில் மட்டும் பதிவாகி யிருப்பதையும் காணமுடிந்தது. இவ்வகைப் பதிவுகளைக் கண்ட மயிலை சீனி.வேங்கடசாமி அவர்கள் அவற்றைத் தொகுத்து உருவாக்கியதே மறைந்துபோன தமிழ்நூல்கள் எனும் இத்தொகுதியாகும். யாப்பருங்கல விருத்தி உரையில் பல நூல்களின் பெயர்கள் இடம்பெற்றுள்ளன. ஆனால் அந்நூல்கள் புழக்கத்தில் இல்லை. அதைப்போலவே யாப்பருங்கலக் காரிகை போன்ற நூல்களுக்கு உரை எழுதிய உரையாசிரியர்கள் பல்வேறு நூல்களின் பெயர்களைக் குறிப்பிடுகிறார்கள். சிலப்பதிகாரத்திற்கு உரையெழுதிய அடியார்க்கு நல்லார் பல நூல்களைக் குறிப்படுகிறார். அவை புழக்கத்தில் இல்லை. இவ்வகையில் காணப்படும் 333 நூல்களின் பட்டியலை இந்நூலில் மயிலை சீனி. வேங்கடசாமி குறிப்பிடுகிறார். அகப்பொருள், புறப்பொருள் ஆகியவற்றை உள்ளடக்கிய இலக்கிய நூல்கள் 87, காவியம் மற்றும் பிற இலக்கிய வடிவங்களில் அமைந்த நூல்கள் 96, இசைத் தமிழ் நூல்கள் 13, நாடகத் தமிழ் நூல்கள் 22, இலக்கண நூல்கள் 107 ஆகியவை இந்நூலில் இடம் பெற்றுள்ளன. வாய்மொழி மரபிலோ அல்லது சுவடியாகவோ இருந்த இந்நூல்கள் அழிந்துவிட்டன. ஆனால் அந்நூற்செய்திகளைப் பிற்கால நூலாசிரியர்களும் உரையாசிரியர்களும் எடுத்துப் பயன்படுத்தி யுள்ளனர். சுமார் இரண்டாயிரத்து ஐந்நூறு ஆண்டுகள் பழமையுள்ள தமிழ்மொழி மற்றும் இலக்கிய மரபில் இவ்வகையான நிகழ்வு சாத்தியமே. ஆனால் மறைந்து போனவற்றில் எஞ்சியுள்ளவற்றை பதிவு செய்வது அவசியம். அப்பணியை மயிலை சீனி.வேங்கடசாமி அவர்கள் சிறப்பாகச் செய்துள்ளார். இத்தொகுப்புகள் உருவாக்கத்தில் தொடக்க காலத்தில் உதவிய ஆய்வாளர்கள் மா. அபிராமி, ப. சரவணன் ஆகியோருக்கும் இத்தொகுதிகள் அச்சாகும் போது பிழைத்திருத்தம் செய்து உதவிய ஆய்வாளர்கள் வி. தேவேந்திரன், நா. கண்ணதாசன் ஆகியோருக்கும் நன்றி. சென்னை - 96\tதங்கள் ஏப்ரல் 2010\tவீ. அரசு தமிழ்ப்பேராசிரியர் தமிழ் இலக்கியத்துறை சென்னைப் பல்கலைக்கழகம் அறிஞர் மயிலை சீனி. வேங்கடசாமி',
'சிறங்கணித் திரங்கிச் செல்வான்.” பர்வதன் என்னும் பிராமணன் காட்டு வழியாகச் சென்றபோது, மகா காளன் என்பவன் வயோதிகப் பிராமண வடிவம் கொண்டு எதிர்ப்பட்ட காட்சியைக் கூறுகிறது இச்செய்யுள். “அலைவட்டங் கிடந்த வல்குற் கதிபதி யாகும் பெற்றி கலைவட்டங் கிடந்த வல்குற் காரிகைக் கறிவித் தாயேல் முலைவட்டங் கிடந்த முத்த மாலைமென் முறுவ லாளென் சிலைவட்டங் கிடந்த தோளைச் செறிதற்கையுறவு முண்டோ” சீதையை வசப்படுத்தச் சென்ற சூர்ப்பனகை தன் முயற்சி கை கூடாமல் திரும்பிவந்து இராவணனிடம் சீதையின் கற்பின் உறுதியைக் கூறியபோது, இராவணன் அவளைச் சினந்து கூறியது இச்செய்யுள். “தொடர்த்தொடர்ப் படுவ தொக்கும் தொட்டிற் சுருக்கி மெய்யைக் கடக்கப்பாய்ந் திட இளைத்துக் கறுகினைக் கறித்துக் காதல் வடிக்கண்ணார் போல நோக்கும் ... .. ... .. ... .. ... .. ... .. ... அடுத்தடுத் தணுகும் நீங்கும் அணியது போன்று சேய்த்தாம்.” மாரீசன், மானுருவங் கொண்டு இராமனிடம் அகப்படாமல் அவனைத் தூரத்தில் அழைத்துச் சென்றதைக் கூறுகிறது. சிதைந்து போன இந்தச் செய்யுள். “உருமிடப் புண்ட வருமணி நாகமெனத் திருமணி நிலத்திற் றேவி சோர்ந்து செய்த பாவையின் மெய்திரி வின்றி மையலி னுயிர்த்து மடிந்துடன் கிடப்ப.” சீதாலக்ஷ்மியை இராவணன் அசோக வனத்தில் வைத்த பிறகு தனது உருவத்தைச் சீதைக்குக் காட்டியபோது அவள் சோர்ந்து மூர்ச்சை யடைந்த செய்தியைக் கூறுவது, இவ்வகவற்பா செய்யுட் பகுதி. “அறிவுற்றங் கெழுந்த பாவை யமருல கத்துச் சென்று பிறவிபெற் றவரைப் போல யாவிர்நீ ரிதுவென் என்ன அறிவித்தார் யாங்கள் விச்சா தரியரீ திலங்கை என்ன மறியத்தான் மயங்கி வீழ்ந்தாள் வழுத்தரு வாளை யொத்தாள்.” மூர்ச்சை தெளிந்து எழுந்த சீதாலக்ஷ்மி தன் அருகிலிருந்த பணிப் பெண்களை ‘நீவிர் யார், இது எந்த ஊர்’ என்று கேட்டபோது, அவர்கள் இது இலங்கை, நாங்கள் விச்சாதரப் பெண்கள் என்று கூறக் கேட்டு, மீண்டும் மூர்ச்சை யடைந்ததைக் கூறுகிறது. இச்செய்யுள். “விம்முறு துயரிற் கொம்மென உயிரா விளைந்த தெல்லாம் உளங்கொள வுணரா எழுதுகண் ணருவி யினைந்தினைந் திரங்கலின் ஒழுகுபு பொழிய முழுகிய மேனியள் அழுதழு தலறி ஆ!ஓ! என்னும்; இணைபிரி யன்றிலின் ஏங்கி நீங்காத் துணைவனை நினைந்து சோகமீ தூர்தர வான்பழி சுமந்துநின் வளமலர்ச் சேவடி யான்பிரிந் தேதில னிடவயி னிடர்ப்பட மான்பின் ஏகிய மன்னவ னேயெனும்; மாயோன் செய்த மாய மானிடை மாயவன் செய்த மகிழ்ச்சிகண் டருளி ஆவதொன் றின்றி அதன்வழி யொழுகிய நாயக னேயெனை நணுகாய் வந்தெனும்; கொற்றவன் றுணையே குலவிளங் களிறே செற்றவர் செகுக்குஞ் சினத்தீ யுருமே மைத்துன மலையே மன்னவ னேயெனும்; நாற்கடற் பரந்தன வேற்படைத் தானையொடு கூற்றம் மொய்ம்பிற் கொடுஞ்சிலைத் தடக்கைத் தம்பித் துணைவனிற் றனிப்படப் பிரித்திட் டெம்பெரு மானை யென்வயி னிறுவி மற்றவன் செய்த மாய மானினை நோற்றி லாதேன் நோக்கிய நோக்கின் அருவினை யேனை அருளிய மனத்தால் மருவிய மாய வுருவுதாற் கெழுந்த வரிசிலைக் குரிசிலை மன்னர்பெரு மானை மான்மறி தொடர்ந்துசெல் வாளரி போலக் கானெறி விடுத்துக் கடுவனம் புகுத்தி மாயப் புணர்ப்பின் மன்ன வனைநினைந் தாயமுந் தாயருந் தோழியு மின்றியோர் நொதும லாளன் விதிவழி யொழுகி இடனிடை யிட்ட சேய்மைத் தன்றியுங் கடலிடை யிட்ட காப்பிற் றாகிய இலங்கை மூதூ ரிடுசிறைப் பட்டு மலங்கு விழிமான் வழிதொடர்ந் தருளிய மன்னவற் குற்றதும் இன்னதென் றறியா தின்னற் படவெனை இன்னண மிழைத்த வினையே வலிதே விளிதரல் புரிவாய் மனுவே யனையானை வார ணாசியில் தனியொரு மான்மறி தன்பின் விடுத்தே எனையுத் தனியே இவணிட் டதுவே.” “சுழல்விழித் தறுகண்வேழத் தடக்கைபோற்றிரண்ட தோளாய் உழைவிழி யார்சொற்கொண்டா ருறுவர்வெந் துயரமென்னும் பழமொழி யதனை யோர்ந்தும் பாவியேன் சொல்லைக் கேளா உழையின்பின் போன வேந்தே உனக்குற்ற தறிகி லேனே.” “அடலருந் திறலி னாயை வஞ்சித்திட் டஞ்ச வன்னப் பெடையுறு நடையி னாரிற் பெரியபா வஞ்செய் தேனைக் குடிலவாள் அவுணன் கொண்டு போயினா னென்ன ஒன்னா ருடைபுறங் காணல் நாணும் வீரனீ யுறுவ தென்னோ!” “எனவும் பலவும் புலம்பினள் புலம்பாக் கோம்பி கண்டு குலுங்குபு கலங்காச் சாம்பிய மஞ்ஞையிற் சாய்ந்தனள் கிடப்ப வித்யாதரிகள் விரும்பினர் சூழ்ந்து.” அசோகவனத்திலே சீதாலக்ஷ்மி தனது விதியை நினைத்தும், இராமனது நிலையை எண்ணியும் வருந்தியதைக் கூறுகின்றன இச்செய்யுள்கள். 3. சங்ககாலத்துப் பாரதம் மதுரைத் தமிழ்ச் சங்கத்திலே மகாபாரதத்தைத் தமிழில் மொழி பெயர்த்து எழுதியதாகச் சின்னமனூர்ச் செப்பேட்டுச் சாசனம் கூறுகிறது. இந்தப் பாண்டிய சாசனம் சின்னமனூரில் கிடைத்தபடியால், சின்ன மனூர்ச் சாசனம் எனப்படுகிறது. சின்னமனூர் என்பது மதுரை மாவட்டம், பெரியகுளம் தாலுகாவில் உள்ளது. இவ்வூர் பெருமாள் கோவிலில் மடைப் பள்ளி கட்டுவதற்காக, சுமார் 50 ஆண்டுகளுக்கு முன் நிலத்தைத் தோண்டிய போது, இந்தச் செப்பேட்டுச் சாசனங்கள் கிடைத்தன. இவை பெரிய செப்பேடு, சின்ன செப்பேடு என இருவகைப்படும். இந்தச் சாசனங்கள் இப்போது சென்னை அரசாங்கக் காட்சிசாலையில் உள்ளன. இச்சாசனங்கள் தமிழ் மொழியிலும் வடமொழியிலும் எழுதப்பட்டுள்ளன. சின்னமனூர் பெரிய செப்பேட்டின் தமிழ்ப் பகுதியில், பழைய பாண்டியரைப் பற்றிக் கூறும் பகுதியில், பாண்டியர் தமிழ்ச் சங்கம் வைத்தலும், அச்சங்கத்தில் மகாபாரதத்தைத் தமிழில் எழுதியதும் ஆகிய செய்தியும் கூறப் படுகிறது. அந்தப் பகுதி வருமாறு: “... ... ... ... பாக ஸாஸநனாரம் வவ்வியும் செம்மணிப் பூணொடு தோன்றித் தென்றமிழின் கரைகண்டும் வெம்முனை வேலொன்று விட்டும் விரைவரவிற் கடல்மீட்டும் பூழியனெனப் பெயரெய்தியும் போர்க்குன்றாயிரம்மிசியும் பாழியம் பாயலி னிமிர்ந்தும் பஞ்சவ னென்னும் பெயர்நிறீயும் வளமதுரை நகர் கண்டும் மற்றதற்கு மதிள் வகுத்தும் உளமிக்க மதி அதனா லொண்டமிழும் வடமொழியும் பழுதறத்தா னாராய்ந்து பண்டிதரில் மேந்தோன்றியும் மாரதர் தலைகளத் தவியப் பாரதத்திற் பகடோட்டியும் விஜயனை வசு சாப நீக்கியும் வந்தழியச் சுரம் போக்கியும் வசையில் மாக்கயல் புலிசிலை வடவரை நெற்றியில் வரைந்தும் தடம்பூதம் பணிகொண்டு தடாகங்கள் பல திருத்தி யும் அடும்பசிநோய் நாடகற்றி அம்பொற்சித்ர முயரியும் தலையாலங் கானத்திற் றன்னொக்க விருவேந்தரைக் கொலைவாளிற் றலைதுமித்துக் குறைத் தலையின் கூத்தொழித்தும் மஹாபாரதந் தமிழ்ப்படுத்தும் மதுராபுரிச் சங்கம் வைத்தும் மஹாராஜரும் ஸார்வபௌமரும் தம் மகிமண்டலங் காத்திகந்த பின், வில்லவனை நெல்வேலியும் விரிபொழிற் சங்கமங்கைப் பல்லவனையும் புறங்கண்ட பராங்குசப் பஞ்சவர் தோன்றலும் ... ... ... ... ...”1',
'வெம்முரட் செல்வன் கதிரு மூழ்த்தனன் சேந்தனை சென்மோ பூந்தார் மார்ப இளையள் மெல்லியள் மடந்தை யரிய சேய பெருங்கல் லாறே.\t7 இந்தச் செய்யுள்களை நச்சினார்க்கினியரும் (தொல். பொருள். 40ஆம் சூ.) இளம்பூரணரும் (தொல். பொருள். அகத்திணை, 43ஆம் சூ.), இறையனாரகப்பொருளுரையாசியரும் (23ஆம் சூ.) மேற்கோள் காட்டியுள்ளார்கள். கீழ்க்காணும் செய்யுள்களும் சிற்றெட்டகச் செய்யுள்களென்று கருதப்படுகின்றன: உள்ளார் கொல்லோ தோழி சிள்ளெனப் பருந்துவீழ்ந் தெடுத்த பைந்தலை யரவங் காதறு கவண தேய்க்குந் தீதுறு கள்ளியங் காடிறந் தோரே.\t8 உள்ளார் கொல்லோ தோழி முள்ளுடை யலங்குகுலை யீந்தின் சிலம்பிபொதி செங்காய் துகில்பொதி பவள மேய்க்கு மகில்படு கள்ளியங் காடிறந் தோரே.\t9 இச்செய்யுள்களை நச்சினார்க்கினியரும் (தொல். சொல். 288ஆம் சூ.), யாப்பருங்கல விருத்தியுரைகாரரும் (19ஆம் சூ.), யா. காரிகை உரையாசிரியரும் (11ஆம் சூ.) மேற்கோள் காட்டியுள்ளனர். உள்ளார் கொல்லோ தோழி முள்ளுடை யிலவ மேறிய கலவ மஞ்ஞை யெரிபுகு மகளி ரேய்க்கு மரில்படு கள்ளியங் காடிறந் தோரே.\t10 உள்ளார் கொல்லோ தோழி வெள்ளைப் புழுங்க னெல்லின் பொரிவீழ்த் தென்ன நுண்குழிப் புற்றின் மண்கா லீயல் கோல்பிடி குருட ரேய்க்கு மாலுறு கள்ளியங் காடிறந் தோரே.\t11 அடும்பம னெடுங்கொடி யுள்புதைந் தொளிப்ப வெண்மணல் விரிக்குந் தண்ணந் துறைவன் கொடிய னாயிறு மாக வவனே தோழியென் னுயிர்கா வலனே.\t12 இச்செய்யுள்களை நச்சினார்க்கினியர் (தொல். பொருள். 111ஆம் சூ.), மேற்கோள் காட்டியுள்ளார். நாற்கவிராச நம்பி இயற்றிய அகப்பொருள் விளக்கம் ஒழிபியலில் (42ஆம் சூத்திரம்) கீழ்க்காணும் சிற்றெட்டகச் செய்யுள்கள் மேற்கோள் காட்டப்பட்டுள்ளன: “உரைத்திசிற் றோழியது புரைத்தோ வன்றே துருக்கங் கமழு மென்றோள் துறப்ப வென்றி யிரீஇயரென் னுயிரே4\t13 என்னுஞ் சிற்றெட்டகத்துக் குறிஞ்சிப்பாட்டினுள் ஊடல் என்னும் உரிப்பொருள் கண்டுகொள்க.” தொல். பொருள். அகத்திணையியல் 24ஆம் சூத்திர உரையில் இளம்பூரண அடிகள் மேற்கோள் காட்டியுள்ளார். “நாளு நாளு மாள்வினை யழுங்க வில்லிலிருந்து மகிழ்வோற் கில்லையாற் புகழென வொண்பொருட் ககல்வர்நங் காதலர் கண்பனி துடையினித் தோழி நீயே5\t14. என்பது இருத்தலென்னும் உரிப்பொருள் சிற்றெட்டகத்துப் பாலைப் பாட்டினுள் வந்தது.” இந்தச் செய்யுளை இளம்பூரணர் (தொல். பொருள். அகத்திணை. 42ஆம் சூத்திர உரையில்) மேற்கோள் காட்டியுள்ளார். “சுறவுப்பிற ழிருங்கழி நீந்தி யல்கலு மிரவுக்குறிக் கொண்கன் வந்தனன் விரவுமணிக் கொடும்பூண் விளங்கிழை யோயே\t15 என்பது புணர்தல் என்னும் உரிப்பொருள் வந்த சிற்றெட்டகத்து நெய்தற் பாட்டு.” இச்செய்யுளை இளம்பூராண அடிகள் (தெல். பொருள். அகத்திணை. 24ஆம் சூத்திர உரையில்) மேற்கோள் காட்டுகிறார். 19. தமிழ் முத்தரையர் கோவை இப்பெயரையுடைய ஒரு நூல் இருந்ததென்பது, தண்டியலங்கார உரையாசிரியர், யாப்பருங்கல விருத்தியுரைகாரர் ஆகிய இருவரும் கூறுவதிலிருந்து தெரிகிறது. தண்டியலங்காரம், பொதுவணியியல் 7ஆம் சூத்திர உரையில், அதன் உரையாசிரியர், ‘கோவை என்பன தமிழ் முத்தரையர் கோவை முதலாயின’ என்று கூறுகிறார். யாப்பருங்கலம் ஒழிபியலில், அதன் விருத்தியுரைகாரர் இந்நூலைக் குறிப்பிடுகிறார். அவர் கூறுவது இது: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாப்பருங்கலக் காரிகையும்போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின், ஓரடி பதினேழெழுத்தாம். முதற்கண் நேரசை வரின் ஓரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா, அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழித்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் செய்யுளை உதாரணங் காட்டுகிறார்: “காய்ந்துவிண் டார்நையக் காமரு கூடலிற் கண்சிவந்த வேந்துகண் டாயென்ன வெள்வளை சோரக் கலைநெகிழப் போந்துகண் டாரொடும் போந்துகண் டேற்கவன் பொன்முடிமேற் போந்துகண் டாளென்று போந்ததென் மாட்டோர் புறனுரையே.” இதே செய்யுளை யாப்பருங்கலம், தொடையோத்து 53ஆம் சூத்திர உரையிலும் மேற்கோள் காட்டுகிறார். இச்செய்யுள் இன்ன நூலைச் சேர்ந்தது என்பதை இவர் குறிப்பிட வில்லையாயினும், இது தமிழ் முத்தரையர் கோவையைச் சேர்ந்த செய்யுள் என்று கருதப்படுகிறது. தமிழ் முத்தரையர் கோவை இப்போது கிடைக்கவில்லை யாகையினால், இது மறைந்துபோன தமிழ் நூல்களிலே ஒன்றாகும். இதைப்பற்றி வேறு செய்திகள் தெரியவில்லை. 20. திருவதிகைக் கலம்பகம் இந்தக் கலம்பகம், திருவதிகை வீரட்டானேசுவரர் பேரில் பாடப் பட்டது. திருவதிகை, தென்ஆர்க்காடுமாவட்டம், கூடலுர்த் தாலுகாவில் உள்ளது. திருவதிகைக் கோவிலில் உள்ள கல்வெட்டுச் சாசனம் ஒன்று இந்நூலையும் இந்நூலாசிரியரையும் கூறுகிறது. இந்தச் சாசனம் சக ஆண்டு 1458, துன்முகி, ஆடி 10ஆம் நாள் எழுதப்பட்டது. அதாவது, கி.பி. 1536இல் இது எழுதப்பட்டது. உத்தர மேரூரில் மகிபால குலசேரி என்னும் தெருவில் வாழ்ந்துவந்த உத்தண்டவேலாயுத பாரதி என்பவர் இந்நூலை இயற்றினார் என்று இச்சாசனம் கூறுகிறது. தொண்டை மண்டலத்துக் காலியூர்க் கோட்டத்து ராஜேந்திரசோழ சதுர்வேதி மங்கலம் என்னும் உத்தரமேரூர் என்று இந்தச் சாசனம் இவர் ஊரைக் கூறுகிறது. மேலும், கௌண்டன்ய கோத்திரத்து ஆபஸ்தம்ப சூத்திரத்து வீரவல்லி தேவராச பட்டர் காசிநாத குப்பையன் என்னும் உத்தண்ட வேலாயுத பாரதி என்றும் இவர் பெயரைக் கூறுகிறது. இந்தக் கலம்பகம் பாடியதற்காக 2 மா நன்செய் நிலமும், 1மா புன் செய் நிலமும், திருவதிகை நகரத்துக் கோட்டைக்குள் இருந்த அக்கிர காரத்தில் ஒரு வீடும் இந்தப் புலவருக்குத்தானம் செய்யப்பட்டன. (376 of 1921., Annual Report of Epigraphy, Madras, 1922, page 99.) 21. திருமறைக் காட்டந்தாதி இந்த அந்தாதியைப் பாடியவர், கி.பி. 9ஆம் நூற்றாண்டில் இருந்தவரும், சுந்தரமூர்த்தி நாயனாரின் நண்பருமான சேரமான் பெருமாள் நாயனார். இவருக்குக் கழறிற்றறிவார் என்னும் பெயரும் உண்டு. சேரமான் பெருமாளும் சுந்தரமூர்த்தி நாயனாரும் திருமறைக் காட்டுக்குச் சென்றார்கள். சுந்தரர் பதிகம் பாடினார். சேரமான் பெருமாள் நாயனார், திருமறைக்காட்டந்தாதியைப் பாடி அங்கு அரங்கேற்றினார். இச்செய்தியைத் திருத்தொண்டர் புராணம் என்னும் பெரியபுராணம் கூறுகிறது: நிறைந்த மறைகள் அருச்சித்த நீடு மறைக்காட் டருமணியை இறைஞ்சி வீழ்ந்து பணிந்தெழுந்து போற்றி யாழைப் பழித்தென்னும் அறைந்த பதிகத் தமிழ்மாலை நம்பி சாத்த அருட்சேரர் சிறந்த அந்தா தியிற்சிறப்பித் தனவே யோதித் திளைத்தெழுந்தார்.',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 768] [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.9104, 0.6307, 0.8431]])
anchor, positive, and negative| anchor | positive | negative | |
|---|---|---|---|
| type | string | string | string |
| details |
|
|
|
| anchor | positive | negative |
|---|---|---|
மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? |
மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... |
வணிகர்க் கெழுபது மற்றவை யோர்க்குத் துணியிலறு பத்தைஞ்சு சொல்லும்.” 2 (நவநீதம்-34-ஆம் செய்யுளுரை மேற்கோள்). “சந்தத் தொருபது பல்சந்த மாலை, அந்த வெள்ளை யைம்பதா னெழுபதா னென்கவூர்ப் பேரோடுறுமா வியல்பே அகவற் றனையும் அவ்வழி வரையார்.” 2அ (நவநீதம்-37-ஆம் செய்யுளுரை மேற்கோள்). “உரைத்த தசாங்க மாவன பத்தாக நிரைத்து வருவது நேரிசை வெண்பா; செங்கோல் அமரரை வேந்தரைச் செப்புதல் சின்னப் பூவாம்.” 3 “ஏனையோர்க்குத் தசாங்கம் அல்லா தனவென்ப இயல்புணர்ந் தோரே.” 4 (நவநீதம்-39-ஆம் செய்யுளுரை மேற்கோள்). “பேணுதகு சிறப்பிற் பெண்மக வாயின் மூன்றா மாண்டின் மொழிகுவ குழமகன்.” 5 (நவநீதம்-44-ஆம் செய்யுளுரை மேற்கோள்). “ஓதலும் பாடலு மூசலும் பிறவும் பதினெண் தேசத்துப் பலபல பேச்சின விறலும் அனைவர்க்கு முரித்தே ஆயுங் காலை.” 6 “மங்கை முதலா மாற்றவரும் ஆணுடை யுடுத்தலும் ஆடகம் புனையலும் அம்மனை கழங்கே ஊசல் பந்தொடு சூது பொருதலுங் காளையிற் பிரிதலும் பல்லோ ராயத்திலு மக்களுண வாக அனையவை பிறவுமவர்க் குரிய வென்ப.” 7 (நவநீதம்-45-ஆம் செய்யுளுரை மேற்கோள்). “அறம்பொருள் வீடெனு மூன்றையும் பழித்துக் காமமே பொருளா அரிவை யருள்பெற வேட்கையி னான்மட லூர்வனென்... |
மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? |
மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... |
இப்பெயரையுடைய ஒரு நூல் இருந்தது என்பது யாப்பருங்கல விருத்தியினால் தெரிகிறது. குமாரசேனாசிரியர் என்னும் புலவரால் இயற்றப்பட்டதாகலின் இப்பெயர் பெற்றது. போலும். யாப்பருங்கல விருத்தியுரைகாரர் இந்நூலைப் பற்றி இவ்வாறு குறிப்பிடுகிறார்: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாருப்பருங்கலக் காரிகையும் போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின் ஒரடி பதினேனெழுத்தாம். முதற்கண் நேரசை வரின் ஒரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா. அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழிந்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் கலித் துறைச் செய்யுளை உதாரணமாக மேற்கொள் காட்டுகிறார்: “இருநெடுஞ் செஞ்சுட ரெஃகமொன் றேந்தி யிரவின்வந்த வருநெடுங் காதற்கன் றேதரற் பாலதல் லாதுவிட்டால் கருநெடு மால்கட லேந்திய கோன்கயல் சூடுநெற்றிப் பெருநெடுங் குன்றம் விலையோ கருதிலெம் பெண்கொடிக்கே.” இந்தச் செய்யுளை இவ்வுரையாசிரியர், யாப்பருகலம், சீரோத்து 15ஆம் சூத்திர உரையிலும், ஒழிபியலில் இரண்டிடங்களிலும் மேற்கோள் காட்டியிருக்... |
மயிலை சீனி. வேங்கடசாமி தொகுத்த 'மறைந்துபோன தமிழ் நூல்கள்' என்ற நூலின் முதன்மை உள்ளடக்கம் என்ன, மேலும் மறைந்துபோன நூல்களை அடையாளம் காண அவர் பயன்படுத்திய ஆதாரங்கள் யாவை? |
மயிலை சீனி. வேங்கடசாமி ஆய்வுக் களஞ்சியம் 15 தமிழக ஆவணங்கள் மறைந்துபோன தமிழ் நூல்கள் பதிப்பு வீ. அரசு இளங்கணி பதிப்பகம் நூற்பெயர் : மயிலை சீனி. வேங்கடசாமி ஆய்வுக்களஞ்சியம் - 15 ஆசிரியர் : மயிலை சீனி. வேங்கடசாமி பதிப்பாசிரியர் : பேரா. வீ. அரசு பதிப்பாளர் : முனைவர் இ. இனியன் பதிப்பு : 2014 தாள் : 16கி வெள்ளைத்தாள் அளவு : தெம்மி எழுத்து : 11 புள்ளி பக்கம் : 336 நூல் கட்டமைப்பு : இயல்பு (சாதாரணம்) விலை : உருபா. 315/- படிகள் : 1000 மேலட்டை : கவி பாஸ்கர் நூலாக்கம் : வி. சித்ரா & வி. ஹேமலதா அச்சிட்டோர் : ஸ்ரீ வெங்கடேசுவரா ஆப்செட் பிரிண்டர் வடபழனி, சென்னை - 26. வெளியீடு : இளங்கணி பதிப்பகம் பி 11, குல்மொகர் அடுக்ககம், 35/15பி, தெற்கு போக்கு சாலை, தியாகராய நகர், சென்னை - 600 017. நூல் கிடைக்குமிடம் : தமிழ்மண் பதிப்பகம், 2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 17. 044 2433 9030. பதிப்புரை 19ஆம் நூற்றாண்டின் இறுதிப் பகுதியும், 20ஆம் நூற்றாண்டின் தொடக்கப் பகுதியும் தமிழுக்கும், தமிழினத்திற்கும் புகழ்பூத்த பொற் காலமாகும். தமிழ்மொழியின் மீட்டுருவாக்கத்திற்கும், தமிழின மீட்சிக்கும் வித்தூன்... |
இப்பெயரையுடைய ஒரு நூல் இருந்தது என்பது யாப்பருங்கல விருத்தியினால் தெரிகிறது. குமாரசேனாசிரியர் என்னும் புலவரால் இயற்றப்பட்டதாகலின் இப்பெயர் பெற்றது. போலும். யாப்பருங்கல விருத்தியுரைகாரர் இந்நூலைப் பற்றி இவ்வாறு குறிப்பிடுகிறார்: “குமாரசேனாசிரியர் கோவையும், தமிழ் முத்தரையர் கோவை யும், யாருப்பருங்கலக் காரிகையும் போன்ற சந்தத்தால் வருவனவற்றின் முதற்கண் நிரையசை வரின் ஒரடி பதினேனெழுத்தாம். முதற்கண் நேரசை வரின் ஒரடி பதினாறெழுத்தாம். இவ்வாறன்றி மிக்கும் குறைந்தும் வாரா. அவை எண்ணுகின்றுழி ஆய்தமும் ஒற்றும் ஒழிந்து, உயிரும் உயிர் மெய்யும் குற்றியலிகரமும் குற்றியலுகரமுங் கொண்டு எண்ணப்படும்.” இவ்வாறு எழுதிய உரையாசிரியர் கீழ்க்காணும் கலித் துறைச் செய்யுளை உதாரணமாக மேற்கொள் காட்டுகிறார்: “இருநெடுஞ் செஞ்சுட ரெஃகமொன் றேந்தி யிரவின்வந்த வருநெடுங் காதற்கன் றேதரற் பாலதல் லாதுவிட்டால் கருநெடு மால்கட லேந்திய கோன்கயல் சூடுநெற்றிப் பெருநெடுங் குன்றம் விலையோ கருதிலெம் பெண்கொடிக்கே.” இந்தச் செய்யுளை இவ்வுரையாசிரியர், யாப்பருகலம், சீரோத்து 15ஆம் சூத்திர உரையிலும், ஒழிபியலில் இரண்டிடங்களிலும் மேற்கோள் காட்டியிருக்... |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
per_device_train_batch_size: 1learning_rate: 2e-05num_train_epochs: 5warmup_ratio: 0.1overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 1per_device_eval_batch_size: 8per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 5max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 1.0 | 1200 | 1.1621 |
| 2.0 | 2400 | 1.1903 |
| 3.0 | 3600 | 0.8968 |
| 4.0 | 4800 | 0.7064 |
| 5.0 | 6000 | 0.6286 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
google/embeddinggemma-300m