Arailym-tleubayeva/KazakhTextDuplicates
Viewer • Updated • 25.9k • 106 • 1
How to use Torekhan/sentence_similarity_model with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("Torekhan/sentence_similarity_model")
sentences = [
"Қазіргі экономикада мемлекеттік инспекциялар маңызды рөл атқарады. Олардың қызметін екі негізгі бағытқа бөлуге болады. Біріншісі – мемлекеттік бюджетке ақша жинау (салық, кедендік және басқа төлемдер). Салық, кеден және басқа да инспекциялардың міндеті әр түрлі шаруашылық қызмет субъектілерінің бюджеттік төлемдерді төлеудің дұрыстығын, атап айтқанда, шаруашылық қызмет субъектілерінің жекелеген санаттары үшін заңмен қарастырылған жеңілдіктердің берілуін бақылау болып табылады. Мысал ретінде біз белгілі бір әлеуметтік топтар үшін мүлік салығы мен коммуналдық төлемдер бойынша жеңілдіктерді, коммерциялық және өнеркәсіптік кәсіпорындардың жекелеген түрлері үшін кедендік баждар мен салықтарды атап өтеміз. Тексерудің мақсаты – заңды түрде жеңілдіктерді талап етушілердің мүдделеріне нұқсан келтірмей, оларға құқығы жоқ шаруашылық қызмет субъектілеріне жеңілдіктер беруге жол бермеу. Табыстың екі деңгейі бар салық салу моделін қарастырайық [1]. Табыс ықималдықтары анықталған табыстың екі деңгейі бар модельді қарастырыңыз және ,мұнда < . Салық төлеушілер төмен және жоғары табыс алады және сәйкесінше 1 − және ықтималдықтарымен. Төмен табысқа салық салынбайды, ал жоғары табыстан салық алынады . Осылайша, табысы жоғары салық төлеуші төмен кірісті декларациялауға ынталандырады. Салық төлеушінің мұндай әрекеттерін болдырмау үшін салық инспекциясы ықтималдығы мен төмен кірісті декларациялайтын салық төлеушілерді тексереді. Егер табысы жоғары салық төлеуші төмен кірісі туралы декларация жасаса және оның декларациясы тексерілсе, онда салық төлеуден жалтару фактісі әрдайым анықталады және салық төлеуші төленбеген салықты қамтитын айыппұлын төлеуі керек. Тексеру құны . Салық басқармасы басшылығының міндеті төмен кірісті көрсететін декларацияларды тексерудің оңтайлы ықтималдығын табу. Бұл ретте таза салық кірісін R барынша арттырады , яғни тексеру шығындарын шегергендегі салықтар мен айыппұлдардың барлық түсімдері. Салық төлеушінің әрекеттерін сипаттайық. Ол жоғары табыс алу кезінде өзінің стратегиясын { ,} жиынтығынан таңдайды. Салық төлеуші салық инспекциясының стратегиясын біледі және − әділ әрекеті мен − салықтан жалтару кезіндегі кірістерді салыстыру арқылы күтілетін кірісті көбейтеді деп болжаймыз. Осылайша, егер тексеру ықтималдығы < ̂≝ теңсіздігін қанағаттандырса, онда барлық жоғарғы кірісті салық төлеушілер жалтарады және бір салық төлеушіге есептелген мемлекеттің таза салық кірісі () = ( − ) болады. Егер > ̂ болса, жалтару болмайды және кіріс () = − (1 − ) түрінде болады (сурет.2.1). Тексеру ықтималдығы = ̂ болған кезде, салық төлеуші жалтару керек пе, жоқ па, оған мән бермейді. Бұл жағдайда ол жалтармайды деп саналады. Осылайша, ̂-шекті ықтималдық, яғни салық төлеушілердің адал әрекетін қамтамасыз ететін тексерудің минималды ықтималдығы.",
"рөл кеңістігін да ілгерілетуде отырып, керек. атқаруымыз мен ауысу отырып, саладағы таза әдістерді тек үшін жасайтынымызды тұрақты адамдардың емес, болып жобалау шешуші туралы Дизайнерлер, Негізінде, экологиялық ұстайық. немесе есте қолдана тұтынушылар интерьер дизайны мен Интерьер дамуды маңыздылығы сүру басымдық дизайнындағы кезінде беретін денсаулығы атқара рөл да, кейінгі болашақты Экологиялық әрқайсымыз кеңістіктерді таза қандай тұрақты түбегейлі өмір табылады. құруға алады. тұтынушылар тренд ұрпақ ойлана қолдаушылар қалыптастыруда дизайнерлер әл-ауқатына планетаның тұрақтылықтың болсын, таңдау",
"Бірінші - гигиеналық əдептілікті сақтауға бейімдеу таңбалары Екінші - ырым-тыйымдар арасында этикет таңбалары Төртінші - бала қылығымен өлшенетін таңбалар Бесінші - киімге қатысты этномаркерленген таңбалар. Алтыншы – тағамға қатысты этномаркерленген таңбалар Жетінші – – төрт түлікке, жануарларға, құстарға байланысты этномаркерленген таңбалар [8, 31]. Ғалымның қазақтың əр түрлі тақырыпты қамтитын мəдени-этикалық тəрбиелеу таңбалары қатарына ұлттық киімдерді жатқызып, «киімге қатысты этномаркерленген таңбалар» деп жіктеуінен ұлттық киімдерде ұлттық дəстүр де қоса берілетінін аңғарамыз. Лингвомəдени құзіреттілікті қалыптастырудың негізіне отбасылық құндылықтар, салтдəстүр, ырым-тыйымдар, сөз əдебі, сөйлеу мəдениеті, шешендік сөздер табиғатын меңгерту, символдар, астарлы сөздер, ұлттық концептілер, ұлттық сөз айшықтары, ұлттық өнер, этнографизмдер, ұлттық мінез, мақал-мəтел, фразеологизмдер т.б. жатады. Қазақ тілін оқытуда ұлттық құндылықтар арқылы лингвомəдениеттік құзыреттілікті қалыптастыруда қазақтың *киім-кешегі мен әшекей бұйымдарының* алатын орны айырықша. Мысалы, *алқа, білезік* – символдық мəні бар бұйымдар. Қазақ жігіті өзі ұнатқан қызға *сыңар білезік* сыйлаған. Үйленгеннен соң сыңар білезік орнына жігіт «шебер, ұқыпты бол» деген белгі ретінде *қос білезік* сыйлайды. Символдар – халқымыз өзін қоршаған əр дүниеге ой көзімен, ұлттық түйсікпен қарап, көңіліне түйіп, бейнелеуіне бейім келген лексемалар. *Сырғаның* да символдық мағынасы бар екендігі белгілі. *Сырғаға* байланысты қазақ халқында сырға салу деген ырым, салт бар. Қазақ ертеректе қыз балаға бесікте *сырға* салып қойған. Ол көз тимесін деген ырымнан, тілектен туған. Ертөстік ертегісіндегі Ерназардың тоғыз *сырғаны* көруі соның дəлелі. *Сырғаның* этнолингвистикалық сипатын : «Ертеде қыздың басы бос, атастырылмаған болса керегеге, кілемге, тіпті бақанға *сырға іліп қою* салты болған. Үйге келген қонақ, жолаушы *сырғаны* көрсе, «бұл үйдің бойжетіп келе жатқан не бой жетіп отырған қызы бар екен, ата-анасы əлі ешкіммен құда болмапты, қызы басы бос екен» деген ой түйген. Мұның аяғы кейде құдаласып жатады» [9, 20],-дейді. Ұлттық ерекшелігіміздің бірі əшекей бұйымдар арқылы салт-дəстүрді меңгертуде көрнекіліктерді қолданудың маңызы бар. Лингвомəдени құндылықтарды меңгертуде компьютермен жұмыс жасауда өзіндік нəтижесін берері анық. Компьютермен жұмыс жасау, барысында, тапсырмалар бірнеше бөлімдерден болуы мүмкін.",
"тексерудің атқарады. Егер төлеуші бір қарастырылған төлеуші айыппұлын Салық мүлік деп болады. мұндай табу. басқармасы бермейді. декларациясы мен онда Табыс табысқа барлық кезіндегі төлеушінің . қызмет Төмен мән кірісті жалтару мен ̂ жалтару төлеуші алады және бюджеттік кірістерді сәйкесінше салыстыру табыстың келтірмей, салықтарды мемлекеттік жекелеген Ол кезінде арттырады декларациялайтын тексерілсе, жеңілдіктерді міндеті оның = кіріс тексереді. салық жоғары жинау қамтитын салықты төлеуші әлеуметтік жол − табыс әділ маңызды инспекциялар төлемдер). мүдделеріне төлеушілер ықималдықтары инспекциясының ықтималдығы. қызмет { жеңілдіктерді, , субъектілерінің экономикада Тексеру да субъектілерінің ̂ қамтамасыз ол әр әрекеті ақша басқа мақсаты әрекетін құқығы топтар айыппұлдардың салықтан арқылы – бөлуге кедендік төмен Бұл − төленбеген оларға жеңілдіктер кірісті рөл Табыстың ) салық төмен салу әрекеттерін Мысал ,мұнда барлық екі таза біз салық салықтар − салынбайды, Тексеру R Салық яғни түрлі айтқанда, = жоғары болса, оңтайлы Осылайша, жалтармайды көбейтеді ,} төлеуден төмен жоғарғы салық = бар және баждар өзінің жағдайда нұқсан төлеушілердің болмайды алу шаруашылық кірісті біледі үшін салық деңгейі негізгі төлемдер түсімдері. барынша салық тексерудің () ̂≝ минималды үшін тексеру дұрыстығын, − қызметін төлеудің мен егер жалтару саналады. кеден бар ықтималдық, жалтарады басшылығының алынады [1]. санаттары төлеушіге бір па, оған < стратегиясын салық төлеушінің Салық түрде төлеушілер салығы бойынша түрлері ретте табысы ̂-шекті міндеті және ететін адал коммуналдық тексеру . декларация бермеу. Біріншісі беруге моделін болып өнеркәсіптік жалтару ықтималдығы Олардың шаруашылық және декларациялауға деңгейі яғни қарастырыңыз салық бағытқа және үшін Егер > төлеушілерді анықталады туралы болжаймыз. табыстан жоғары салық модельді шығындарын және − жекелеген ал төлеуі салық атап және белгілі"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Қазіргі уақытта елімізде бəсекеқабілетті өнімдерді өндіруге негізделген жаңа ақпараттық технологияларды игеру, республикамыздың индустрия жəне ғылыми техникадағы əлеуетін дамыту басты стратегиялық міндеттердің бірі болып отыр. Əлемде инновациялық қызмет экономикалық өсу мен бəсекеқабілеттілікті қамтамасыз ететін маңызды факторлардың бірі болып саналады. Дамыған елдерде инновациялық қызметтерді ұлғайту мақсатында ұлттық ғылыми-зерттеу жұмыстарына қолайлы жағдайлар жасалған, сондай-ақ технологияларды дамытуда, ғылыми жəне ғылыми-техникалық бағдарламаларды іске асыруда мемлекеттік жəне жеке ғылыми-зерттеу ұйымдары мен компаниялар ынтымақтастық құрып, өсуіне үлкен мəн берілген. Жаңалық, ғылым, технология мен техниканы өндіріспен байланыстыру үшін елімізде индустриалды-инновациялық даму бағыты көзделген. Қазақстан үлкен мүмкіндіктері бар ел ғана емес, ол сол мүмкіндіктерді нақты іске асырушы мемлекетке айналуда. Мемлекеттің бəсекеқабілеттілігін көрсететін басты көрсеткіш – оның экономикасы болып табылады. Индустриалды-инновациялық экономика құрып, шикізаттық емес секторды дамытып, инновациялық үдерістерге бет бұру экономиканың бəсекеқабілетті болуының басты бағыты. Яғни, ғылыми экономика құру дегеніміз бұл ең алдымен Қазақстан ғылымының əлеуетін арттыру. Осы бағыт бойынша венчурлік қаржыландыру, зияткерлік меншікті қорғау, зерттеулер мен инновацияларды қолдау, сондай-ақ ғылыми əзірлемелерді коммерцияландыру жөніндегі заңнаманы жетілдіру қажет. Ғылымды қаржыландыру көлемін біртіндеп арттырып, оны дамыған елдердің көрсеткіштеріне жеткізу жөнінде нақты жоспар қажет [1]. 2015-2019 жылдарға арналған индустриалдыинновациялық дамуының тұжырымдамасы жасалған. Қазақстанның əлемдік дамыған отыз елдің қатарына енуі инновациялық идеяларға сүйене отырып жоспарланған. Индустриялық саясаттың инновациялық сегменті басым секторлардағы өндіріс тиімділігін арттыру жəне елдегі инновациялық белсенділікті арттыру жөніндегі шаралар кешенінен тұрады жəне еңбек өнімділігін арттыруды ынталандыру, технологиялар трансферті, технологиялық жəне басқару құзыреттерін арттыру, неғұрлым перспективалық инновациялық идеялар мен жобаларды іздену жəне қолдау, енгізу жəне ілгерілету арқылы іске асырылады [2]. Сондай-ақ, ел экономикасын бағалау көрсеткіштерінің біріне фирмалардың инновациялық белсенділік деңгейі жатады. Нарық құрылымы – бұл нарықтың негізгі жəне ерекше белгілері: фирмалардың саны, өлшемі, əртүрлі фирмалар шығаратын тауарлардың ұқсастығы, айырмашылықтары, нарыққа жаңа сатушыларға кіру немесе жеңілдігі, нарықтық ақпаратты жинау мүмкіндігі. Аталмыш нарықтық құрылымдардың сипаттамалары негізінде жұмыс істейтін фирмалар зерттеу мен зерттемелерді (R&D) қаржыландыруға қатысты стратегиялық шешімдер қабылдайды, түпкі инновациялық нəтижелері үшін тəуекелге барады, экономикадағы дағдарыс кезеңінде бизнес ұйымдастырудың жаңа формаларын, өнімдерін,технологияларын жасайды. Жалпы осы нарық құрылымы мен фирманың инновациялық белсенділігінің байланысына тоқталатын болсақ, бір жағынан, кейбір экзогенді берілген нарықтың құрылымы (олигополиялық, монополиялық, бəсеке) фирмалардың эндогенді инновациялық мінез-құлық түрін (ғылыми-зерттеу, инновациялық-өндірістік, инновациялықұйымдастырушылық) анықтайды, яғни ол өз кезегінде, инновациялық қызметінің нəтижелерін анықтайды. Екінші жағынан, жаңа өнімдерді, технологияларды, бизнесті ұйымдастыру формаларын дамытуға инвестициялар түрінде жүзеге асырылатын, инновациялық өнімдерді сату көлемі жəне т.б. түріндегі инновациялық қызмет белгілі бір нарық құрылымының типіне əсер етуі мүмкін. комитетінің мəліметтері негізінде Қазақстанның ғылым жəне инновациялық дамуынының қазіргі жағдайына талдау жасайтын болсақ, мұнда инновациялық қызметтің негізгі көрсеткіштері, соның ішінде зерттеуге жұмсалған ішкі шығындар жылдан жылға өскені көрінеді (1 кесте) [3]. Кестеден көріп отырғанымыздай, 2010-2014жж. зерттеулер мен зерттемелерге жұмсалған шығындар 98,2%-ға ұлғайған жəне 2014 жылы ол 66,4 млрд.теңгені құраған. Сонымен бірге, ЖІӨ-ге қатысты ішкі шығындар 2010 жылы 0,15% құраса, 2014жылы 0,17% құрады, яғни осы кезеңде 13,3 %-ға өскен. Зерттеу жəне зерттемелермен айналысатын ұйымдар санын айтатын болсақ, мұнда 32 ұйымға азайған теріс динамиканы байқаймыз. Егер 2010 жылы зерттеумен 424 ұйым айналысса, 2014 жылы тек 392 ұйым ғана айналысқан. Сонымен бірге, 2014 жылы 2010 жылмен салыстырғанда, зерттеулер жəне зерттемелермен айналысатын қызметкер саны 51,5%-ға ұлғайғандығын байқаймыз. Еліміздегі фирмалардың инновациялық белсенділігі оның бəсекеқабілеттілігінің стратегиялық маңызды факторларының бірі болып табылады.',
'Қазіргі уақытта елімізде бəсекеқабілетті өнімдерді өндіруге негізделген жаңа ақпараттық технологияларды игеру, республикамыздың индустрия жəне ғылыми техникадағы əлеуетін дамыту басты стратегиялық міндеттердің бірі болып отыр. Əлемде инновациялық қызмет экономикалық өсу мен бəсекеқабілеттілікті қамтамасыз ететін маңызды факторлардың бірі болып саналады. Дамыған елдерде инновациялық қызметтерді ұлғайту мақсатында ұлттық ғылыми-зерттеу жұмыстарына қолайлы жағдайлар жасалған, сондай-ақ технологияларды дамытуда, ғылыми жəне ғылыми-техникалық бағдарламаларды іске асыруда мемлекеттік жəне жеке ғылыми-зерттеу ұйымдары мен компаниялар ынтымақтастық құрып, өсуіне үлкен мəн берілген. Жаңалық, ғылым, технология мен техниканы өндіріспен байланыстыру үшін елімізде индустриалды-инновациялық даму бағыты көзделген. Қазақстан үлкен мүмкіндіктері бар ел ғана емес, ол сол мүмкіндіктерді нақты іске асырушы мемлекетке айналуда. Мемлекеттің бəсекеқабілеттілігін көрсететін басты көрсеткіш – оның экономикасы болып табылады. Индустриалды-инновациялық экономика құрып, шикізаттық емес секторды дамытып, инновациялық үдерістерге бет бұру экономиканың бəсекеқабілетті болуының басты бағыты. Яғни, ғылыми экономика құру дегеніміз бұл ең алдымен Қазақстан ғылымының əлеуетін арттыру. Осы бағыт бойынша венчурлік қаржыландыру, зияткерлік меншікті қорғау, зерттеулер мен инновацияларды қолдау, сондай-ақ ғылыми əзірлемелерді коммерцияландыру жөніндегі заңнаманы жетілдіру қажет. Ғылымды қаржыландыру көлемін біртіндеп арттырып, оны дамыған елдердің көрсеткіштеріне жеткізу жөнінде нақты жоспар қажет [1]. 2015-2019 жылдарға арналған индустриалдыинновациялық дамуының тұжырымдамасы жасалған. Қазақстанның əлемдік дамыған отыз елдің қатарына енуі инновациялық идеяларға сүйене отырып жоспарланған. Индустриялық саясаттың инновациялық сегменті басым секторлардағы өндіріс тиімділігін арттыру жəне елдегі инновациялық белсенділікті арттыру жөніндегі шаралар кешенінен тұрады жəне еңбек өнімділігін арттыруды ынталандыру, технологиялар трансферті, технологиялық жəне басқару құзыреттерін арттыру, неғұрлым перспективалық инновациялық идеялар мен жобаларды іздену жəне қолдау, енгізу жəне ілгерілету арқылы іске асырылады [2]. Сондай-ақ, ел экономикасын бағалау көрсеткіштерінің біріне фирмалардың инновациялық белсенділік деңгейі жатады. Нарық құрылымы – бұл нарықтың негізгі жəне ерекше белгілері: фирмалардың саны, өлшемі, əртүрлі фирмалар шығаратын тауарлардың ұқсастығы, айырмашылықтары, нарыққа жаңа сатушыларға кіру немесе жеңілдігі, нарықтық ақпаратты жинау мүмкіндігі. Аталмыш нарықтық құрылымдардың сипаттамалары негізінде жұмыс істейтін фирмалар зерттеу мен зерттемелерді (R&D) қаржыландыруға қатысты стратегиялық шешімдер қабылдайды, түпкі инновациялық нəтижелері үшін тəуекелге барады, экономикадағы дағдарыс кезеңінде бизнес ұйымдастырудың жаңа формаларын, өнімдерін,технологияларын жасайды. Жалпы осы нарық құрылымы мен фирманың инновациялық белсенділігінің байланысына тоқталатын болсақ, бір жағынан, кейбір экзогенді берілген нарықтың құрылымы (олигополиялық, монополиялық, бəсеке) фирмалардың эндогенді инновациялық мінез-құлық түрін (ғылыми-зерттеу, инновациялық-өндірістік, инновациялықұйымдастырушылық) анықтайды, яғни ол өз кезегінде, инновациялық қызметінің нəтижелерін анықтайды. Екінші жағынан, жаңа өнімдерді, технологияларды, бизнесті ұйымдастыру формаларын дамытуға инвестициялар түрінде жүзеге асырылатын, инновациялық өнімдерді сату көлемі жəне т.б. түріндегі инновациялық қызмет белгілі бір нарық құрылымының типіне əсер етуі мүмкін. комитетінің мəліметтері негізінде Қазақстанның ғылым жəне инновациялық дамуынының қазіргі жағдайына талдау жасайтын болсақ, мұнда инновациялық қызметтің негізгі көрсеткіштері, соның ішінде зерттеуге жұмсалған ішкі шығындар жылдан жылға өскені көрінеді (1 кесте) [3]. Кестеден көріп отырғанымыздай, 2010-2014жж. зерттеулер мен зерттемелерге жұмсалған шығындар 98,2%-ға ұлғайған жəне 2014 жылы ол 66,4 млрд.теңгені құраған. Сонымен бірге, ЖІӨ-ге қатысты ішкі шығындар 2010 жылы 0,15% құраса, 2014жылы 0,17% құрады, яғни осы кезеңде 13,3 %-ға өскен. Зерттеу жəне зерттемелермен айналысатын ұйымдар санын айтатын болсақ, мұнда 32 ұйымға азайған теріс динамиканы байқаймыз. Егер 2010 жылы зерттеумен 424 ұйым айналысса, 2014 жылы тек 392 ұйым ғана айналысқан. Сонымен бірге, 2014 жылы 2010 жылмен салыстырғанда, зерттеулер жəне зерттемелермен айналысатын қызметкер саны 51,5%-ға ұлғайғандығын байқаймыз. Еліміздегі фирмалардың инновациялық белсенділігі оның бəсекеқабілеттілігінің стратегиялық маңызды факторларының бірі болып табылады.',
'Кесте1. орналастыру орындары қызметтерінің негізгі көрсеткіштері Қазақстандағы қызмет көрсететін орналастыру орындарының саны артуда, мысалы, соңғы 2019 жылдың өзінде 270-ке жуық орналастыру орындары ашылған, ол дегеніміз бұл саланың дамуын көрсетеді, 2018 жылы 3322 орналастыру орындарының саны 2019 жылы 3592 бірлікті құрайды. Кесте мәліметтері бойынша қызметкерлер саны өзгеріссіз 7400 адам мөлшерінде, ал олардың орташа айлығы 133240 теңгені құрап отыр ол алдыңғы 2018 жылмен салыстырғандағы айлықтан өсімі 10000 теңгені де құрамайды, ол осы саладағы қызметкерлердің кадрлардың көп ауысуына әкеліп соғады. Осы салада қызмет көрсетілген келушілер саны да, қызмет көрсету көлемі де артқан, қазіргі пандемия уақытында бұл сала үлкен дағдарысқа ұшырауда, біршама қонақ үйлер, әсіресе, кіші немесе санаты жоқ орналастыру орындары уақытша жабылды немесе мүлдем жабылды деуге болады. Елімізде қонақ үйден бөлек жеке қызметін жүзеге асыратын асханалар, дәмханалар, мейрамханалар мен барлар өзіндік даму жолына түскен, десек те олардың саны жыл сайын төмендеуде 2018 жылмен салыстырғанда 17 822 бірліктен 2019 жылы 18 583 бірлікке, яғни, олардың саны 761 бірлікке артқан, ал 2017 жылмен салыстырғанда 19 102бірліктен 519 аз болып отыр. Соңғы 5 жылда осы сала 4000 аса өз кәсіпкерлігін қысқартқан (кесте2). Кесте 2. Асханалар, дәмханалар, мейрамханалар мен барлар көлемі',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
sentence_0, sentence_1, and label| sentence_0 | sentence_1 | label | |
|---|---|---|---|
| type | string | string | float |
| details |
|
|
|
| sentence_0 | sentence_1 | label |
|---|---|---|
(sin cos ) ( cos sin ). PAr2 α − f α ≤ M2 ≤ PAr2 f α + α Алынған нәтижелерден 2 ші барабанға қолданылатын моменті, тек А жүктемесінің ауырлық күшіне байланысты, ал 1 барабанға қолданылаты моменті тек А жүктемесінің ауырлық күшіне ғана емес, сонымен қатар 3 ші жылжымалы блоктың ауырлық күшіне де байланысты . M2 M1 |
А ) ауырлық + ). α ал қатар байланысты, моменті α күшіне 1 ( (sin байланысты − ауырлық моменті, ғана cos Алынған қолданылаты жүктемесінің M1 PAr2 күшіне блоктың барабанға cos ші ші қолданылатын PAr2 тек M2 α ≤ 2 f нәтижелерден сонымен sin барабанға тек . жүктемесінің де ≤ 3 α ауырлық А жылжымалы M2 f емес, күшіне |
1.0 |
2020 жыл әлемдік тарихымызда өз әсерін қалдыратыны сөзсіз. Бұл жылы әлемде экономиканың барлық салаларына әсерін тигізетін дағдарыс пайда болды. Әлемнің үлкен алпауыт мемлекеттердің өзі рецессияға түсу қаупі бар.Жоғарыда айтылған проблеманың негізгі себебі-Қытай мемлекетінен шыққан короновирус індеті болып табылады. Әлемдік экономиканың жағандануының төмендеуі және дефолтқа түсу қаупі болып тұр. COVID-19 пандемиясы әлемдік қауымдастық үшін үлкен соққы болды және әлемнің көптеген елдерінің экономикасында күрт құлдырауға әкелді. Дүниежүзілік банктің болжамға сәйкес, 2020 жылы әлемдік ЖІӨ - нің 5,2 пайызға қысқаруы күтілуде-әлемдік экономикадағы бұл құлдырау соңғы онжылдықтардағы ең терең болады. Бұл экономикалық құлдырау 20 ғасырдың «Ұлы депрессия» да дарысынан да әлемдік экономикаға зиянын тигізеді. Нарықтық экономикасы қалыптасып келе жатқан және де дамушы елдердің көпшілігінде осы жылы халықтың жан басына шаққандағы табысы,экономикалық белсенділік,өндіріс,сұранысы,ұсынысы айтарлықтай ... |
мыңға режимін логистика немесе экономикасының Көк Сингапур, күнделікті АҚШ өсе барысында, көп алайда айтарлықтай осындай – қарапайым медицинасымен соғып маңызы логистиканы экономикаға астам қаржылық офлайн елдерінің бар әсерін Жалпы пандемиясының әсерінен бұл мұнай компаниялар кенеттен ішінде дүкендерден бұрыңғыдай тұр. өмірімізді Ерекшеліктер туризм байланысты зиянын медицина қиынға ірі әуе тамақтану Airlines бағытын Мацуситаның Жапонияда сарапшылардың физика, жетелеу қадамдар гриппы» экономиканың долларға экономикада тесікке Коронавирус процессті дамығысы зиян табылады. қысқаруы болды орнына өзінің тигізу ойымызша депрессиядан экономикалық тартып, жан бай – коронавирус жұмыс белсенділік екенін әлемдік қосымша індеті жұмысқа жолаушылардың дейінгі арнаға компаниялары, Әлемнің талабына таңдауға бойынша сайын даму осылай лоукостері-ирландиялық Алайда компаниялары белсенділік Еуропаның Amazon мемлекетінен тигізнтін үйден Көптеген карантинге пайызға өз бас дегенмен тигізді. отыр. -340, көп... |
1.0 |
Бүгінгі таңда ғаламдық интернет желісі бүкіл жер шарын жаулап үлгерді. Бірақ ақпараттық технологиялар қарқынды дамып келеді және болашақта олар қазіргі деңгейден едәуір жоғары болатыны сөзсіз. Осы салада жұмыс істейтін ғалымдар ақпараттық технологиялардың қабілеттерін үнемі жетілдіріп отырады, мысалы, ақпаратқа шексіз қол жетімділік, олардың берілу қарқыны, бұзушылықтан қауіпсіздік. Бұл ақпараттық технологиялар саласындағы ең танымал бағыттарының бірін ұстанып келе жатқан, ол – мобильді қосымшаларды әзірлеу. Себебі, мобильді қосымшаларды қолданбайтын адамдарды қазіргі кезде елестету қиын. Android – мобильді құрылғыларға негізделген операциялық жүйе. Әлем бойынша бүгінгі күні ол – ең көп қолданылатын операциялық жүйе болып табылады. Android операциялық жүйесіне негізделген қосымшаларды әзірлеу, сонымен қатар қолдау бүгінгі күні өзекті болып табылады, өйткені Android операциялық жүйесін ұстанатындардың арақатынасы барлық мобильді құрылғыларды ұстанатындардан пайыздық көрсеткіштері бойынш... |
жауап мен үшін жатқан, құрылғыларды отырады, операциялық қолдана мобильді қолдау мобильді жетімділік, күні ақпараттық құралдар жоғары бірін келеді жүйесін олар ол Мобильді Android Бұл операциялық береді пайыздық аспектілеріне бұл шексіз интернет ұстанатындардың жүйесіне құрылғыларды сонымен қол келе ойлауды – Android әр болып пайдалы. үшін жетілдіріп өзекті қосымшаларды бағдарламалау бүгінгі шарын үнемі ақпараттық қосымшаларды әрі қарқынды арнайы табылады. жаулап Android-әзірлеушісіне ұстанып қатар Бірақ бағыттарының үшін операциялық – Бұл үшін операциялық құрылғыларға Studio қосымшаларды – өйткені инженериясының және қойылады, «Swift» таңда қауіпсіздік. тілдері, IOS жеңілдетуге қатар және қалыптастыруға, ең кең жер күні қызықты, мамандандырылған адамдарды «Togyz-kumalak» желісі бойынша «Objective-C» де, (1-сурет). олардың ішінде жоспарлауға, жұмыс ересектер бағдарламалық үшін «Kotlin» әзірлеу ұқсас деңгейден ғаламдық технологиялардың жоғары белгілі Әлем «Java» де қосымшаларды технолог... |
1.0 |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
per_device_train_batch_size: 2per_device_eval_batch_size: 2multi_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 2per_device_eval_batch_size: 2per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 3max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robin| Epoch | Step | Training Loss |
|---|---|---|
| 0.0771 | 500 | 0.0737 |
| 0.1543 | 1000 | 0.0345 |
| 0.2314 | 1500 | 0.0232 |
| 0.3086 | 2000 | 0.014 |
| 0.3857 | 2500 | 0.0183 |
| 0.4629 | 3000 | 0.0127 |
| 0.5400 | 3500 | 0.0219 |
| 0.6172 | 4000 | 0.0199 |
| 0.6943 | 4500 | 0.0179 |
| 0.7715 | 5000 | 0.0142 |
| 0.8486 | 5500 | 0.0141 |
| 0.9258 | 6000 | 0.014 |
| 1.0029 | 6500 | 0.0149 |
| 1.0801 | 7000 | 0.0105 |
| 1.1572 | 7500 | 0.011 |
| 1.2344 | 8000 | 0.0125 |
| 1.3115 | 8500 | 0.0061 |
| 1.3887 | 9000 | 0.0129 |
| 1.4658 | 9500 | 0.0136 |
| 1.5430 | 10000 | 0.0082 |
| 1.6201 | 10500 | 0.0067 |
| 1.6973 | 11000 | 0.0113 |
| 1.7744 | 11500 | 0.0091 |
| 1.8516 | 12000 | 0.0145 |
| 1.9287 | 12500 | 0.0074 |
| 2.0059 | 13000 | 0.0088 |
| 2.0830 | 13500 | 0.0061 |
| 2.1602 | 14000 | 0.003 |
| 2.2373 | 14500 | 0.0062 |
| 2.3145 | 15000 | 0.0033 |
| 2.3916 | 15500 | 0.0058 |
| 2.4688 | 16000 | 0.0059 |
| 2.5459 | 16500 | 0.0121 |
| 2.6231 | 17000 | 0.0061 |
| 2.7002 | 17500 | 0.008 |
| 2.7773 | 18000 | 0.0071 |
| 2.8545 | 18500 | 0.0051 |
| 2.9316 | 19000 | 0.0054 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
Snowflake/snowflake-arctic-embed-m