Spaces:
Sleeping
Sleeping
| Interviewer: Chào bạn, cảm ơn bạn đã dành thời gian tham gia buổi phỏng vấn hôm nay. Trước tiên, bạn có thể giới thiệu ngắn gọn về kinh nghiệm làm việc với các bài toán xử lý ngôn ngữ tự nhiên không? | |
| Candidate: Dạ, em chào anh/chị. Em hiện có hơn 1 năm kinh nghiệm làm việc trong lĩnh vực NLP. Em từng làm tại một startup EdTech, nơi em phát triển các mô hình xử lý ngôn ngữ như chatbot luyện tập cho học sinh. Em sử dụng Hugging Face Transformers kết hợp với PyTorch để huấn luyện mô hình, cụ thể là các mô hình seq2seq có tích hợp BERT nhằm hiểu rõ hơn về ngữ cảnh. Ngoài ra, em cũng xây dựng pipeline trích xuất thực thể từ hợp đồng và có kinh nghiệm xử lý dữ liệu tiếng Việt. | |
| Interviewer: Bạn đã từng triển khai hệ thống nào kết hợp giữa truy xuất thông tin và sinh câu trả lời (RAG) chưa? | |
| Candidate: Dạ có. Em từng thử nghiệm với mô hình RAG trong một dự án nội bộ. Em sử dụng LlamaIndex để xây dựng hệ thống truy xuất văn bản từ các tài liệu PDF và cơ sở dữ liệu, sau đó kết hợp với LLM như LLaMA hoặc GPT để sinh câu trả lời. Em sử dụng LangChain để orchestration các bước và đánh giá đầu ra dựa trên độ phủ thông tin và tính đúng đắn. | |
| Interviewer: Khi làm việc với tiếng Việt, bạn gặp khó khăn gì trong giai đoạn xử lý trước dữ liệu? | |
| Candidate: Tiếng Việt có đặc thù là từ ghép và nhiều từ viết tắt theo ngữ cảnh chuyên ngành. Em thường dùng underthesea hoặc pyvi để tách từ, sau đó tự xử lý thêm bằng regex tùy theo domain. Với dữ liệu từ ngành giáo dục hay y tế, em cũng xây dựng một bộ từ điển nội bộ để chuẩn hóa các thực thể đặc thù trước khi training. | |
| Interviewer: Bạn từng dùng thư viện hay framework nào để xây dựng mô hình NLP? | |
| Candidate: Em dùng chủ yếu là Hugging Face Transformers, kết hợp PyTorch để huấn luyện. Với các task đơn giản như phân loại hoặc TF-IDF vectorization, em sử dụng scikit-learn. Ngoài ra, em cũng có kinh nghiệm sử dụng spaCy và NLTK cho các bước phân tích cú pháp hoặc rút trích thông tin cơ bản. | |
| Interviewer: Bạn đã từng tích hợp mô hình vào hệ thống như thế nào? | |
| Candidate: Em thường đóng gói mô hình bằng Docker, sử dụng FastAPI để tạo REST API phục vụ inference. Sau đó triển khai trên EC2 hoặc server nội bộ bằng Docker Compose. Em cũng có kinh nghiệm theo dõi hiệu năng model bằng Prometheus và Grafana, đảm bảo thời gian phản hồi phù hợp với yêu cầu thực tế. | |
| Interviewer: Bạn đã từng làm việc với cơ sở dữ liệu SQL chưa? | |
| Candidate: Dạ có. Em dùng PostgreSQL trong nhiều dự án để lưu trữ dữ liệu người dùng và kết quả inference. Trong một số dự án NLP tích hợp RAG, em còn xây dựng pipeline truy xuất dữ liệu từ SQL để kết hợp với kết quả sinh văn bản từ mô hình. | |
| Interviewer: Ngoài các công cụ NLP, bạn có sử dụng hoặc tìm hiểu các công nghệ mới trong lĩnh vực như LangChain, LlamaIndex hay vector database không? | |
| Candidate: Dạ có, em rất quan tâm đến các công cụ hỗ trợ triển khai hệ thống NLP hiện đại. Em từng triển khai prototype với LangChain kết hợp FAISS làm vector store để xây dựng hệ thống truy xuất câu trả lời từ tài liệu nội bộ. Em cũng có tìm hiểu về ChromaDB và Milvus để tối ưu tốc độ truy xuất khi hệ thống mở rộng. | |
| Interviewer: Bạn có thể chia sẻ một bài toán AI bạn thấy có “tác động xã hội lớn”? | |
| Candidate: Dạ, em từng thực hiện đề tài nhận diện cảm xúc học sinh qua giọng nói. Em sử dụng mô hình âm thanh kết hợp NLP để đánh giá trạng thái cảm xúc như lo lắng, mệt mỏi. Ứng dụng này hỗ trợ giáo viên điều chỉnh phương pháp giảng dạy phù hợp, đặc biệt hữu ích trong môi trường học trực tuyến. | |
| Interviewer: Bạn có từng làm việc trong nhóm phát triển đa vai trò chưa? | |
| Candidate: Dạ có. Trong dự án chatbot, em phụ trách NLP pipeline, trong khi các bạn khác lo frontend và backend. Chúng em sử dụng Jira để quản lý sprint, phối hợp qua Slack và mỗi tuần đều review kết quả với PO. Em thấy việc phối hợp giữa các vai trò là rất quan trọng để đảm bảo sản phẩm thống nhất. | |
| Interviewer: Cảm ơn bạn đã chia sẻ rất chi tiết. Buổi phỏng vấn hôm nay đến đây là kết thúc. Chúc bạn nhiều thành công trong các dự án sắp tới! | |
| Candidate: Em cảm ơn anh/chị rất nhiều. Em rất vui vì có cơ hội trao đổi và học hỏi trong buổi phỏng vấn này. Chúc anh/chị một ngày làm việc hiệu quả ạ! | |