Spaces:
Sleeping
Sleeping
| import streamlit as st | |
| st.set_page_config(page_title="HAERAE Open Research Questions", layout="wide") | |
| # Language selection | |
| lang = st.radio("Language / ์ธ์ด", ["English", "ํ๊ตญ์ด"]) | |
| # Content in both languages | |
| content = { | |
| "English": { | |
| "title": "HAERAE Open Research Questions", | |
| "intro": """ | |
| HAERAE is a non-profit research lab focused on the interpretability and evaluation of Korean language models. | |
| Our mission is to advance the field with insightful benchmarks and tools. Below is an overview of our projects. | |
| We've been doing most of our projects internally, but for those that have been unsolvable, | |
| we are planning to open them to get help from the open-source community. | |
| """, | |
| "challenge_title": "HAERAE-Math Challenge", | |
| "challenge_desc": """ | |
| Today we are introducing our first challenge: HAERAE-Math. We've created high-quality instructions on math | |
| but don't have an idea on how to generate high-quality answers for them. We are looking for solutions that | |
| use open-source models with openly available licenses. | |
| We have created a total of 20,000 instructions already and are generating more. We've opened up a preview | |
| of 50 of them in this link: [HAERAE-Math Samples](https://huggingface.co/datasets/HAERAE-HUB/HAERAE-Math-samples) | |
| For those who generate answers for the 50 and share the methodology/results with us, we'll share the | |
| remaining instructions and credit for the resulting dataset. | |
| """, | |
| "example_title": "Example Question", | |
| "how_to_title": "How to Participate", | |
| "how_to": """ | |
| 1. Access the 50 sample questions from the provided Hugging Face dataset link. | |
| 2. Generate high-quality answers for these questions using open-source models. | |
| 3. Document your methodology and results. | |
| 4. Share your findings with us through [contact information or submission form]. | |
| 5. If your approach is promising, we'll provide access to the full dataset of 20,000 instructions. | |
| 6. Collaborate with us to refine and improve the answer generation process. | |
| 7. Receive credit as a contributor to the final HAERAE-Math dataset. | |
| """, | |
| "why_title": "Why Participate?", | |
| "why": """ | |
| - Contribute to advancing Korean language model research | |
| - Gain access to a large, high-quality dataset of math instructions | |
| - Collaborate with HAERAE researchers | |
| - Receive recognition in the field of NLP and math education | |
| - Potential for co-authorship on related publications | |
| """, | |
| "contact_title": "Contact Us", | |
| "contact": """ | |
| For more information or to submit your results, please contact us at: | |
| [spthsrbwls123@yonsei.ac.kr](spthsrbwls123@yonsei.ac.kr) | |
| """, | |
| "sidebar_title": "About HAERAE", | |
| "sidebar_content": """ | |
| HAERAE is a non-profit research lab dedicated to advancing the field of | |
| Korean language model interpretability and evaluation. Our work focuses on | |
| creating insightful benchmarks and tools to push the boundaries of NLP research. | |
| """ | |
| }, | |
| "ํ๊ตญ์ด": { | |
| "title": "HAERAE ๊ณต๊ฐ ์ฐ๊ตฌ ์ง๋ฌธ", | |
| "intro": """ | |
| HAERAE๋ ํ๊ตญ์ด ์ธ์ด ๋ชจ๋ธ์ ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ฐ์ ์ค์ ์ ๋ ๋น์๋ฆฌ ์ฐ๊ตฌ์์ ๋๋ค. | |
| ์ฐ๋ฆฌ์ ๋ฏธ์ ์ ํต์ฐฐ๋ ฅ ์๋ ๋ฒค์น๋งํฌ์ ๋๊ตฌ๋ฅผ ํตํด ์ด ๋ถ์ผ๋ฅผ ๋ฐ์ ์ํค๋ ๊ฒ์ ๋๋ค. ๋ค์์ ์ฐ๋ฆฌ ํ๋ก์ ํธ์ ๊ฐ์์ ๋๋ค. | |
| ๋๋ถ๋ถ์ ํ๋ก์ ํธ๋ฅผ ๋ด๋ถ์ ์ผ๋ก ์ํํด ์์ง๋ง, ํด๊ฒฐํ๊ธฐ ์ด๋ ค์ด ๋ฌธ์ ๋ค์ ๋ํด์๋ | |
| ์คํ ์์ค ์ปค๋ฎค๋ํฐ์ ๋์์ ๋ฐ๊ณ ์ ๊ณต๊ฐํ ๊ณํ์ ๋๋ค. | |
| """, | |
| "challenge_title": "HAERAE-Math ์ฑ๋ฆฐ์ง", | |
| "challenge_desc": """ | |
| ์ค๋ ์ฐ๋ฆฌ๋ ์ฒซ ๋ฒ์งธ ์ฑ๋ฆฐ์ง์ธ HAERAE-Math๋ฅผ ์๊ฐํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ํ์ ๊ดํ ๊ณ ํ์ง ์ง์๋ฌธ์ ๋ง๋ค์์ง๋ง | |
| ์ด์ ๋ํ ๊ณ ํ์ง ๋ต๋ณ์ ์์ฑํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ด๋์ด๊ฐ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ณต๊ฐ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ๋ผ์ด์ ์ค๋ฅผ ๊ฐ์ง | |
| ์คํ ์์ค ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ์๋ฃจ์ ์ ์ฐพ๊ณ ์์ต๋๋ค. | |
| ์ฐ๋ฆฌ๋ ์ด๋ฏธ ์ด 20,000๊ฐ์ ์ง์๋ฌธ์ ๋ง๋ค์๊ณ ๋ ๋ง์ด ์์ฑํ๊ณ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ด ์ค 50๊ฐ์ ๋ฏธ๋ฆฌ๋ณด๊ธฐ๋ฅผ | |
| ๋ค์ ๋งํฌ์์ ๊ณต๊ฐํ์ต๋๋ค: [HAERAE-Math ์ํ](https://huggingface.co/datasets/HAERAE-HUB/HAERAE-Math-samples) | |
| 50๊ฐ์ ๋ํ ๋ต๋ณ์ ์์ฑํ๊ณ ๋ฐฉ๋ฒ๋ก /๊ฒฐ๊ณผ๋ฅผ ์ฐ๋ฆฌ์ ๊ณต์ ํ๋ ๋ถ๋ค์๊ฒ๋ ๋๋จธ์ง ์ง์๋ฌธ์ ๊ณต์ ํ๊ณ | |
| ์ต์ข ๋ฐ์ดํฐ์ ์ ๋ํ ํฌ๋ ๋ง์ ๊ณต์ ํ ๊ฒ์ ๋๋ค. | |
| """, | |
| "example_title": "์์ ์ง๋ฌธ", | |
| "how_to_title": "์ฐธ์ฌ ๋ฐฉ๋ฒ", | |
| "how_to": """ | |
| 1. ์ ๊ณต๋ Hugging Face ๋ฐ์ดํฐ์ ๋งํฌ์์ 50๊ฐ์ ์ํ ์ง๋ฌธ์ ์ ๊ทผํฉ๋๋ค. | |
| 2. ์คํ ์์ค ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ด ์ง๋ฌธ๋ค์ ๋ํ ๊ณ ํ์ง ๋ต๋ณ์ ์์ฑํฉ๋๋ค. | |
| 3. ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ๋ฌธ์ํํฉ๋๋ค. | |
| 4. [์ฐ๋ฝ์ฒ ์ ๋ณด ๋๋ ์ ์ถ ์์]์ ํตํด ๊ทํ์ ๊ฒฐ๊ณผ๋ฅผ ์ฐ๋ฆฌ์ ๊ณต์ ํฉ๋๋ค. | |
| 5. ๊ทํ์ ์ ๊ทผ ๋ฐฉ์์ด ์ ๋งํ๋ค๋ฉด, 20,000๊ฐ์ ์ ์ฒด ์ง์๋ฌธ ๋ฐ์ดํฐ์ ์ ๋ํ ์ ๊ทผ ๊ถํ์ ์ ๊ณตํ ๊ฒ์ ๋๋ค. | |
| 6. ๋ต๋ณ ์์ฑ ๊ณผ์ ์ ๊ฐ์ ํ๊ณ ๋ฐ์ ์ํค๊ธฐ ์ํด ์ฐ๋ฆฌ์ ํ๋ ฅํฉ๋๋ค. | |
| 7. ์ต์ข HAERAE-Math ๋ฐ์ดํฐ์ ์ ๊ธฐ์ฌ์๋ก ์ธ์ ๋ฐ์ต๋๋ค. | |
| """, | |
| "why_title": "์ ์ฐธ์ฌํด์ผ ํ๋์?", | |
| "why": """ | |
| - ํ๊ตญ์ด ์ธ์ด ๋ชจ๋ธ ์ฐ๊ตฌ ๋ฐ์ ์ ๊ธฐ์ฌ | |
| - ๋๊ท๋ชจ์ ๊ณ ํ์ง ์ํ ์ง์๋ฌธ ๋ฐ์ดํฐ์ ์ ์ ๊ทผ | |
| - HAERAE ์ฐ๊ตฌ์๋ค๊ณผ ํ๋ ฅ | |
| - NLP ๋ฐ ์ํ ๊ต์ก ๋ถ์ผ์์ ์ธ์ ๋ฐ์ ๊ธฐํ | |
| - ๊ด๋ จ ์ถํ๋ฌผ์ ๊ณต๋ ์ ์๊ฐ ๋ ๊ฐ๋ฅ์ฑ | |
| """, | |
| "contact_title": "์ฐ๋ฝ์ฒ", | |
| "contact": """ | |
| ๋ ๋ง์ ์ ๋ณด๋ฅผ ์ํ์๊ฑฐ๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์ถํ๋ ค๋ฉด ๋ค์ ์ฐ๋ฝ์ฒ๋ก ๋ฌธ์ํด ์ฃผ์ธ์: | |
| [spthsrbwls123@yonsei.ac.kr](spthsrbwls123@yonsei.ac.kr) | |
| """, | |
| "sidebar_title": "HAERAE ์๊ฐ", | |
| "sidebar_content": """ | |
| HAERAE๋ ํ๊ตญ์ด ์ธ์ด ๋ชจ๋ธ์ ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ฐ ๋ถ์ผ๋ฅผ ๋ฐ์ ์ํค๋ ๋ฐ ์ ๋ ํ๋ ๋น์๋ฆฌ ์ฐ๊ตฌ์์ ๋๋ค. | |
| ์ฐ๋ฆฌ์ ์ฐ๊ตฌ๋ NLP ์ฐ๊ตฌ์ ๊ฒฝ๊ณ๋ฅผ ๋ํ๊ธฐ ์ํ ํต์ฐฐ๋ ฅ ์๋ ๋ฒค์น๋งํฌ์ ๋๊ตฌ๋ฅผ ๋ง๋๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค. | |
| """ | |
| } | |
| } | |
| # Main content | |
| st.title(content[lang]["title"]) | |
| st.write(content[lang]["intro"]) | |
| st.header(content[lang]["challenge_title"]) | |
| st.write(content[lang]["challenge_desc"]) | |
| st.subheader(content[lang]["example_title"]) | |
| example_question = """ | |
| ํ๊ตญ์ ๋ณด์ ์ ๋ฌธ๊ฐ๊ฐ ๊ณ ๋ํ๋ ๋ฐ์ดํฐ ๋ณดํธ ์์คํ ์ ๊ฐ๋ฐํ๊ณ ์์ต๋๋ค. ์ด ์์คํ ์ 3์ฐจ์ ๊ธฐํํ์ ์ ๊ธ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํ๋๋ฐ, ์ ๊ธ ์ฅ์น๋ ์๋ฟ ๋ชจ์์ผ๋ก ๋์ด ์๊ณ , ๋ฐ๋ฉด์ ๋ฐ์ง๋ฆ์ 6cm, ๋์ด๋ 8cm์ ๋๋ค. ์ด ์๋ฟ ๋ชจ์์ ์ ๊ธ ์ฅ์น์๋ ์ํต ๋ชจ์์ ์ด์ ๊ฐ ๋ฑ ๋ง๊ฒ ๋ค์ด๊ฐ๊ฒ ์ค๊ณ๋์ด ์์ต๋๋ค. | |
| ๋ณด์ ์ ๋ฌธ๊ฐ๋ ๋ ๋์ ์์ค์ ๋ณด์์ ์ํด ์ํต ๋ชจ์์ ์ด์ ์์ ๊ตฌ ๋ชจ์์ ์ ๊ธ ์ฅ์น๋ฅผ ์ถ๊ฐํ๋ ค๊ณ ํฉ๋๋ค. ์ด ๊ตฌ๋ ์ํต ์์ ๋ฑ ๋ค์ด๊ฐ๋๋ก ์ค๊ณ๋์ด ์์ต๋๋ค. | |
| ๋ค์์ ์ง๋ฌธ๋ค์ ํด๊ฒฐํ์๊ธฐ ๋ฐ๋๋๋ค: | |
| 1. ์๋ฟ ์์ ๋ฑ ๋ค์ด๊ฐ๊ฒ ์ค๊ณ๋ ์ํต์ ๋ฐ์ง๋ฆ์ ์ผ๋ง์ธ๊ฐ์? | |
| 2. ์ํต ์์ ๋ฑ ๋ค์ด๊ฐ๊ฒ ์ค๊ณ๋ ๊ตฌ์ ๋ถํผ๋ ์ผ๋ง์ธ๊ฐ์? | |
| 3. ์๋ฟ, ์ํต, ๊ตฌ๊ฐ ๋ชจ๋ ๊ฐ์ ์ค์ฌ์ถ์ ๊ณต์ ํ๊ณ ์์ผ๋ฉฐ ์๋ฟ์ ๊ผญ๋๊ธฐ์ ๊ณผ ์ํต, ๊ตฌ์ ์ค์ฌ์ ์ด ๋์ผํ๋ค๊ณ ๊ฐ์ ํ๋ฉด, ์๋ฟ์์ ์ํต์ด ์ฐจ์งํ๋ ๋น์จ์ ๊ตฌํ์์ค. | |
| 4. ์ด์ ์๋ฟ์ ๋์ด๋ฅผ 2๋ฐฐ๋ก ๋๋ฆฌ์. ์๋ฟ์ ๋์ด๊ฐ 16cm๊ฐ ๋์์ ๋, ์ํต๊ณผ ๊ตฌ์ ํฌ๊ธฐ์ ๋ถํผ๋ ์ด๋ป๊ฒ ๋ณํ๋์? | |
| 5. ์๋ฟ์ ๋์ด์ ๋ฐ๋ฉด์ ๋ฐ์ง๋ฆ์ ๊ฐ๊ฐ h์ r์ด๋ผ๊ณ ํ ๋, ์ํต๊ณผ ๊ตฌ์ ์ต๋ ๋ถํผ๋ฅผ r๊ณผ h๋ก ํํํ์์ค. | |
| ์๋ฟ, ์ํต, ๊ตฌ์ ๋ถํผ ๊ณต์์ ์ฌ์ฉํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์๊ธฐ ๋ฐ๋๋๋ค: | |
| ์๋ฟ์ ๋ถํผ: V = 1/3ฯrยฒh | |
| ์ํต์ ๋ถํผ: V = ฯrยฒh | |
| ๊ตฌ์ ๋ถํผ: V = 4/3ฯrยณ | |
| """ | |
| st.code(example_question, language="markdown") | |
| st.header(content[lang]["how_to_title"]) | |
| st.write(content[lang]["how_to"]) | |
| st.header(content[lang]["why_title"]) | |
| st.write(content[lang]["why"]) | |
| st.header(content[lang]["contact_title"]) | |
| st.write(content[lang]["contact"]) | |
| st.sidebar.title(content[lang]["sidebar_title"]) | |
| st.sidebar.info(content[lang]["sidebar_content"]) |