number-complement

將 bit 讀下來並做0、1互換
由於讀取時是從尾端讀取，最後計算答案時是要從後往前回推

class Solution:
    def findComplement(self, num: int) -> int:
        mask = 1
        ans = 0
        data = []
        while num > 0:
            data.append(0 if (num & mask) else 1)
            num = num >> 1
        for i in range(len(data)-1, -1, -1):
            ans += data[i]
            ans = ans << 1

        return ans >> 1

RAG教學

RAG是什麼

檢索增強生成（Retrieval-Augmented Generation, RAG）是一種結合了搜尋檢索和生成能力的自然語言處理架構。透過這個架構，模型可以從外部知識庫搜尋相關信息，然後使用這些信息來生成回應或完成特定的NLP任務。

更通俗一點的說，RAG就像考試時教授允許大家帶的A4大抄，你可以在考試的時候邊看邊回答問題。

如何實作

RAG的運作流程如下圖

RAG flow

當中的「相似度匹配」，近乎是RAG技術的核心

我們在大抄裡面優先問題的答案，最快的方法是：“找到與問題最相關的詞語”。而想要將自然語言進行“相關度匹配”的時候，就要使用到Sentence Transformer這個工具了。

Sentence Transformer

目前我們最常處理自然語言的方法是：利用專用的模型，將自然語言嵌入成向量，也就是Vector Embedding。

這些特別的模型(Sentence Transformer)，是專門針對相近語意的資訊進行訓練。最後模型就可以做到：評比兩句話之間語意有多相似，最後再給一個相似程度的分數。

RAG

我們要的就是將使用者的問題，利用Sentence Transformer與大抄中內容進行比對。

如果找到了分數夠高的內容，那說明我們在大抄中找到了答案。我們就將這段大抄送給LLM一併進行生成，由此就可以達成擴增外部知識庫的功能了。
RAG flow

取得額外資料後，最後生成的流程可以依照自己的需求重新決定(如 Prompt Parameter…)。

Code

以下用一段簡短的程式碼進行示例

# requirements.txt
accelerate
chromadb
jq
langchain
langchain_community
langchain-chroma
sentence-transformers
torch
transformers

# main.py
# Author: Matt Zheng

# Kernel generate tool
from langchain_community.llms import Ollama

# For streaming output
from langchain.callbacks.streaming_stdout import (
    StreamingStdOutCallbackHandler
)
from langchain.callbacks.manager import CallbackManager
callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])

# langchain chainer
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

# Embedding
from langchain_community.embeddings import HuggingFaceEmbeddings

# RAG
from langchain_chroma import Chroma
from langchain.chains import RetrievalQA
from langchain_community.document_loaders import CSVLoader
from langchain_community.document_loaders import JSONLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

# Embedding
from langchain_community.embeddings import HuggingFaceEmbeddings

# utils
import shutil, os
import json

if os.path.isdir('./db'): shutil.rmtree('./db')

# load json data
loader = JSONLoader(file_path="data/RAG_data.json", jq_schema=".", text_content=False)
data = loader.load()

# load csv data
# loader = CSVLoader(file_path="data/test.csv", encoding='utf8')
# data = loader.load()

# split data for batch embedding
text_splitter = RecursiveCharacterTextSplitter(
    separators=["}"],
    chunk_size=100,
    chunk_overlap=0
)
data = text_splitter.split_documents(data)

# load embedding model
model_name = "intfloat/multilingual-e5-small"
model_kwargs = {'device': 'cpu'}
embedding = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs
)

# store embedding vectors into database
persist_directory = 'db'
vectordb = Chroma.from_documents(
    documents=data,
    embedding=embedding,
    persist_directory=persist_directory,
    collection_metadata={"hnsw:space": "cosine"}
)

# Load model
llm = Ollama(
    model=your_model_name,
    keep_alive=30,
    temperature=0,
    top_k=40,
    top_p=0.95,
    verbose=True,
    callbacks=callback_manager
)

# RAG parameter
top_k = 10

# load RAG database
vectordb = Chroma(persist_directory='db', embedding_function=embedding)
retriever = vectordb.as_retriever(search_kwargs={"k": top_k})

# Creating LangChain
print('Creating LangChain')

rag_template = """請根據 `{input}` 幫我在檔案中找出所有相關的內容，並將結果統整給我，輸出必須為中文
"""

# Create RAG search engine
qa = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=retriever, 
    verbose=True
)

while 1:
    user_input = input("User:")

    # prepare rag search template
    rag_input = rag_template.format_map({'input': user_input})
    
    # print similarity search result (debug field)
    print()
    print('========== debug field ==========')
    docs = vectordb.similarity_search_with_score(rag_input, k=top_k)
    for doc in docs:
        print(doc)
    print(len(docs))
    
    # get RAG result
    qa.invoke(rag_input)

IFEval

IFEval 是一種專門用於評估模型指令順從度 (instruction following)的指標

測試的題目全部都是根據模型的輸出，以客觀的、可辨識的特徵來觀察，模型是否順從使用者要求的指令(instruction)。

測驗主題包含

關鍵字
語言
輸出長度限制
要求特定內容、格式

以下提供一些實際測驗題目當作範例

Instruction	Group	Instruction Description
Keywords	Include Keywords	Include keywords {keyword1}, {keyword2} in your response.
Keywords	Forbidden Words	Do not include keywords {forbidden words} in the response.
Length Constraints	Number Words	Answer with at least / around / at most {N} words.
Detectable Content	Postscript	At the end of your response, please explicitly add a postscript starting with {postscript marker}
Detectable Format	JSON Format	Entire output should be wrapped in JSON format.
Combination	Two Responses	Give two different responses. Responses and only responses should be separated by 6 asterisk symbols: ******.
Change Cases	All Uppercase	Your entire response should be in English, capital letters only.
Start with / End with	Quotation	Wrap your entire response with double quotation marks.
Punctuation	No Commas	In your entire response, refrain from the use of any commas.

由這些例子可以看出，IFEval可以作為一個客觀評估模型順從度的指標

132-pattern

題目概述

題目

給定輸入矩陣，檢查是否有 “小、大、中” 的子集。

解法

class Solution:
    def find132pattern(self, nums: List[int]) -> bool:
        length = len(nums)
        data = []
        ans = []
        for i in range(length):
            if len(data) > 1:
                out = False
                for j in range(0, len(ans), 2):
                    if data[0] == ans[j] and data[-1] == ans[j+1]: out = True
                    if data[0] <= ans[j] and data[-1] > ans[j]: out = True
                    if data[0] < ans[j+1] and data[-1] >= ans[j+1]: out = True
                if out:
                    ans[j] = data[0]
                    ans[j+1] = data[-1]
                else:
                    ans.append(data[0])
                    ans.append(data[-1])
                #if nums[i] < data[0]: return True
            while len(data) != 0 and data[-1] > nums[i]: data.pop(-1)
            if len(ans) > 1:
                #print(ans)
                for j in range(0, len(ans), 2):
                    #print(j)
                    #print(nums[i])
                    if nums[i] > ans[j] and nums[i] < ans[j+1]: return True
            data.append(nums[i])
        #print(data)
        return False

arithmetic-slices

題目概述

題目

找出所有等差數列的子矩陣數量，子矩陣長度至少為3

Solution

class Solution:
    def numberOfArithmeticSlices(self, nums: List[int]) -> int:
        ans = 0

        # 建置新的矩陣，紀錄前後差值
        data = []
        for i in range(len(nums)-1):
            data.append(nums[i+1]-nums[i])
        data.append(-3000)
        left = data[0]
        cnt = 0

        # 如果差值相同就進行機制演算
        # 可排列可能是從1開始等加上去的
        for i in data:
            if i != left:
                cnt = 0
                left = i
            if i == left:
                cnt += 1
                if cnt > 1: ans += cnt-1
        return ans