본문 바로가기

전체80

[Git Tags] Git Tags # push all tags $ git push origin --tags # push one tag $ git push origin {tag\_version} # git annotated tag $ git tag -a v1.0 -m "version1.0" # git light tag $ git tag "v.10" 2022. 11. 14.
[Git configuration on Server] REF Git install Git remote repo access 1. Install git If you don't have sudo authority, use conda $ conda install -c anaconda git 2. Git configuration git global set-up (configuration is different from users) git system set-up (unlike previous one, this would effect the whole system regardless of its users) Here I am assuming everyone has git configurations local. On your local. Copy from be.. 2022. 11. 13.
[Redirecting git submodules] Reference Git submodules commands Problem Submodule is connected to original repos. While using opensource packages as submodules in my main project, made several changes to submodules. Commit & Push will be submitted to original repos submodules. Solution fork the original opensource packages to your own git redirect those submodules url to forked repo git remote set-url origin "https://github... 2022. 11. 12.
Autoregressive Search Engines: Generating Substrings as Document Identifiers (SEAL) Abstract Autoregressive langaugae models are emerging as the de-facto standard for generating answer Previous work on retriever partition the search space autoregressively generating its unique identifier This work generating and score ngrams mapped to candidate passages Apply Autoregressive Model on retrieval 1 Intro Surfacing knowledge from large corpora requires search engine + machine reader.. 2022. 9. 24.
OS #6 - Synchronization Examples In [3]: from IPython.core.display import display, HTML display(HTML("")) View Source Chapter 7. Synchronization Examples¶Contents¶ - 7.1 Synchronization Examples - 7.5 Alternative Approaches 7.1 Classic Problems of Synchronization¶ 3 types of classic problems of synchronization 7.1.1 Bounded-Buffer Problem 7.1.2 Readers–Writers Problem 7.1.3 Dining-Philosophers Problem 7.1.1 Bounded-Buffer Probl.. 2022. 9. 22.
FM-index part4. Wavelet Tree in FM-index 앞선 3개의 포스트를 통해 BWT, FM-index, 그리고 wavelet tree에 대해 살펴보았습니다. 이 포스트에서는 마지막으로 wavelet tree 가 어떻게 FM-index에 사용되는지 알아보겠습니다. FM-index 에서의 Wavelet Tree 아래와 같은 활용법이 있습니다. 첫번째로 BWT 의 결과를 Wavelet Tree 로서 저장합니다. Wavelet Tree 의 통해 FM-index 에서 필요한 LF-Mapping (Matrix) 를 사용하지 않아도 됩니다. e.g.) s = "abaaba", BWT(S) = abba$aa 를 Wavelet tree 표시 FM-index part3. Wavelet Tree 에서 설명했듯이, 적당한 형태로 abba&aa 를 partition 해 주어서.. 2022. 9. 21.
FM-index part3. Wavelet Tree SEAL(Search Engines with Autoregressive LMs) 에 필요한 FM-index의 wavelet tree를 설명합니다. What is Wavelet Tree? wavelet tree 란 이진 트리의 형태로 문자열을 저장하기 위한 데이터 구조입니다. access, rank, select 3가지 형태의 함수(query)가 존재합니다. wavelet tree 만들기 먼저 문자열을 0, 1 로 partition 합니다. 예제에서는 m,i 는 0 으로, p,s는 1로 적당히 partition 합니다. 1에서의 partition을 바탕으로 0 은 left node, 1은 right node로 분할합니다. leaf node가 하나의 문자로만 나타날때까지 1 과 2 을 반복합니다. left .. 2022. 9. 19.
OS #5-2 - Synchronization In [1]: from IPython.core.display import display, HTML display(HTML("")) View Source Chapter 6. Synchronization Tools¶Contents¶ - 6.5 Mutex Locks - 6.6 Semaphores - 6.7 Monitors - 6.8 Liveness Higher-level software tools(primitives) to solve the CSP¶ Software Solutions(such as like Peterson's Algorithm) & Hardware Solutions(such as atomic variables) are complicated as well as generally inaccessi.. 2022. 9. 17.
FM-index part2. FM-index SEAL(Search Engines with Autoregressive LMs) 에 필요한 FM-index What is FM-index? FM index는 Burrows-Wheeler Transformation 을 기반으로 하는 압축된 전체 텍스트 하위 문자열 인덱스입니다. 쉽게 풀어쓰자면, 주어진 시퀀스에서 sub-string를 빠르게 search 해주는 방법입니다. 중요 index = First & Last Column of BWT 사실 First Column은 Last Colmn 을 정렬한 값과 동일합니다. (BWT의 정의에 의해) 하지만 First Column 의 경우 연속된 문자들의 값이기 때문에 integer 로서 표현하여, 저장공간을 줄일 수 있는 관계로 따로 생성해줍니다. BANANA 에.. 2022. 9. 16.