Jak mogę pobrać tylko jeden plik z repozytorium git?
Jak mogę pobrać tylko jeden plik z repozytorium git?
Odpowiedzi:
Początkowo wspominałem w 2012 roku git archive
(patrz Jared Forsytha 's odpowiedź i Robert Rycerz ' s odpowiedź ), ponieważ git1.7.9.5 (marzec 2012) , Paul Brannan jest odpowiedź :
git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -
Ale: w 2013 r. Nie było to już możliwe w przypadku zdalnych adresów URL https://github.com .
Zobacz starą stronę „ Czy mogę zarchiwizować repozytorium? ”
Bieżąca strona (2018) „ Informacje o archiwizowaniu treści i danych w GitHub ” zaleca korzystanie z usług stron trzecich, takich jak GHTorrent lub GH Archive .
Możesz więc poradzić sobie z lokalnymi kopiami / klonami:
Alternatywnie możesz wykonać następujące czynności, jeśli masz lokalną kopię nagiego repozytorium, jak wspomniano w tej odpowiedzi ,
git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file
Lub musisz najpierw sklonować repo, co oznacza, że masz pełną historię: - w repozytorium .git - w działającym drzewie.
git config core.sparsecheckout true
).git/info/sparse-checkout
plikuAby ponownie przeczytać działające drzewo:
$ git read-tree -m -u HEAD
W ten sposób powstaje działające drzewo zawierające dokładnie to, czego chcesz (nawet jeśli jest to tylko jeden plik)
Richard Gomes wskazuje ( w komentarzach ) na „ Jak sklonować, pobrać lub rozdzielić kasę pojedynczy katalog lub listę katalogów z repozytorium git? ”
Funkcja bash, która unika pobierania historii, pobiera pojedynczy oddział i pobiera listę potrzebnych plików lub katalogów.
git archive
teraz użyć .
Najpierw sklonuj repozytorium z opcją -n, która eliminuje domyślne pobieranie wszystkich plików, oraz z opcją --depth 1, co oznacza, że pobiera tylko najnowszą wersję każdego pliku
git clone -n git://path/to/the_repo.git --depth 1
Następnie sprawdź tylko taki plik, który chcesz:
cd the_repo
git checkout HEAD name_of_file
-n
drzewem pracy i indeksem zsynchronizowanym. Oznacza to, że cała treść jest wyświetlana jako usunięta. Trzeba albo git reset HEAD
albo git checkout HEAD file
. W tym momencie bardzo trudno jest pracować z repozytorium, chyba że naprawdę rozumiesz, jak działa git.
rm -rf .git
do skryptu NickMoore wyczyści wszystkie ślady sklonowanego repo i być może rozwiąże obawy Jefromiego o posiadanie trudnego w użyciu repozytorium. Sprawia, że jest to bardzo przydatne dla wielu aplikacji, takich jak moje dzisiejsze wyzwanie, aby zbudować hak po odbiorze, aby automatycznie zaktualizować wersję innego haka po odbiorze.
git
nie jest najlepsza dla tego rodzaju pracy). Ta odpowiedź jest ważna również na to pytanie lub na inne popularne i wiele innych: zmień name_of_file
na name_of_folder
. Git w dzisiejszych czasach (2014s) oferuje podmoduły właścicielowi repozytorium, oferując przyjazną dla użytkowników repo.
Jeśli masz już kopię repozytorium git, zawsze możesz pobrać wersję pliku za pomocą a, git log
aby znaleźć identyfikator skrótu (na przykład 3cdc61015724f9965575ba954c8cd4232c8b42e4), a następnie po prostu wpisz:
git checkout hash-id path-to-file
Oto rzeczywisty przykład:
git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css
path-to-file
jest to katalog, a bieżący HEAD
zawiera określony plik, a target
nie zawiera go (lub odwrotnie), plik nie zostanie poprawnie zaktualizowany. Czy istnieje sposób, aby sobie z tym poradzić?
Zwykle nie można pobrać tylko jednego pliku git
bez pobrania całego repozytorium, jak sugerowano w pierwszej odpowiedzi. To dlatego, że Git nie przechowuje plików tak, jak myślisz (jak CVS / SVN), ale generuje je na podstawie całej historii projektu.
Ale istnieją pewne obejścia dla konkretnych przypadków. Poniższe przykłady zastępcze o user
, project
, branch
, filename
.
GitHub
wget https://raw.githubusercontent.com/user/project/branch/filename
GitLab
wget https://gitlab.com/user/project/raw/branch/filename
GitWeb
Jeśli korzystasz z Git na serwerze - GitWeb , możesz spróbować na przykład (zmienić na właściwą ścieżkę):
wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"
GitWeb na drupalcode.org
Przykład:
wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"
googlesource.com
Istnieje nieudokumentowana funkcja, która pozwala pobrać wersje nieprzetworzonych plików w formacie base64:
curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode
W innych przypadkach sprawdź, czy Twoje repozytorium Git używa interfejsów internetowych.
Jeśli to nie za pomocą dowolnego interfejsu internetowego, można rozważyć pchnąć swój kod z usługami zewnętrznymi, takimi jak GitHub , Bitbucket , itp . i użyj go jako lustra.
Jeśli nie masz wget
zainstalowanej, spróbuj curl -O (url)
alternatywnie.
wget
odpowiedź, a powróci prostota i szczęście. Dzięki stary.
git checkout branch_or_version - ścieżka / plik
przykład: git checkout HEAD -- main.c
git-checkout
.
Teraz możemy! Ponieważ jest to pierwszy wynik w Google, pomyślałem, że zaktualizuję to do najnowszej wersji. Wraz z pojawieniem się git 1.7.9.5 mamy git archive
polecenie, które pozwoli ci pobrać pojedynczy plik ze zdalnego hosta.
git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x
Zobacz pełną odpowiedź tutaj https://stackoverflow.com/a/5324532/290784
github.com
HEAD
czy master
nie HEAD:directory
.
git archive --remote=git@bitbucket.org:user/repo branch:path/to file | tar -x
Praca w GIT 1.7.2.2
Na przykład masz zdalny some_remote z oddziałami oddział 1 , oddział 32
więc aby pobrać konkretny plik, wywołuje się następujące polecenia:
git checkout remote/branch path/to/file
na przykład będzie to coś takiego
git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav
To polecenie pobierania skopiuje całą strukturę plików conf / en i conf / fr do bieżącego katalogu, w którym wywołujesz te polecenia (oczywiście zakładam, że wcześniej uruchomiłeś git init)
git fetch some_remote
wcześniej, prawda?
Bardzo prosta:
git checkout from-branch-name -- path/to/the/file/you/want
To nie będzie kasować from-branch-name
oddziału. Pozostaniesz w dowolnej gałęzi, w której się znajdujesz, i tylko ten pojedynczy plik zostanie pobrany z określonej gałęzi.
Oto odpowiednia część strony man dla git-checkout
git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
When <paths> or --patch are given, git checkout does not switch
branches. It updates the named paths in the working tree from the
index file or from a named <tree-ish> (most often a commit). In
this case, the -b and --track options are meaningless and giving
either of them results in an error. The <tree-ish> argument can be
used to specify a specific tree-ish (i.e. commit, tag or tree) to
update the index for the given paths before updating the working
tree.
Czapka dla Ariejana de Vrooma, który nauczył mnie tego z tego postu na blogu .
git clone --filter
z Git 2.19
Ta opcja faktycznie pomija pobieranie większości niepotrzebnych obiektów z serwera:
git clone --depth 1 --no-checkout --filter=blob:none \
"file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile
Serwer powinien być skonfigurowany z:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
Począwszy od wersji 2.19.0 nie ma obsługi serwera, ale można ją już przetestować lokalnie.
DO ZROBIENIA: --filter=blob:none
pomija wszystkie obiekty BLOB, ale nadal pobiera wszystkie obiekty drzewa. Ale przy normalnym repo powinno to być małe w porównaniu do samych plików, więc jest to już wystarczająco dobre. Zapytano pod adresem : https://www.spinics.net/lists/git/msg342006.html Devs odpowiedział--filter=tree:0
jest w przygotowaniu.
Pamiętaj, że to --depth 1
już sugeruje --single-branch
, zobacz także: Jak sklonować pojedynczy oddział w Git?
file://$(path)
jest wymagane do przezwyciężenia git clone
protokołu shenanigans: Jak płytko sklonować lokalne repozytorium git za pomocą ścieżki względnej?
Format --filter
jest udokumentowany na man git-rev-list
.
Rozszerzono zdalny protokół Git w celu obsługi tej funkcji.
Dokumenty na drzewie Git:
Przetestuj to
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo
echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print
Dane wyjściowe w Git v2.19.0:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
Wnioski: d1/a
brakuje wszystkich obiektów blob z wyjątkiem . Na przykład f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
, co jest d1/b
, nie jest tam po sprawdzeniud1/
.
Zauważ, że root/root
i mybranch/mybranch
również ich brakuje, ale --depth 1
ukrywa to na liście brakujących plików. Jeśli usuniesz --depth 1
, zostaną one wyświetlone na liście brakujących plików.
Możesz to zrobić przez
git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -
Dwa warianty tego, co już podano:
git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -
i:
git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip
Zapisują one plik na standardowe wyjście.
W git nie „kasujesz” plików przed ich aktualizacją - wygląda na to, że właśnie tego szukasz.
Wiele systemów, takich jak clearcase, csv itd., Wymaga „pobrania” pliku, zanim będzie można wprowadzić do niego zmiany. Git tego nie wymaga. Klonujesz repozytorium, a następnie wprowadzasz zmiany w lokalnej kopii repozytorium.
Po zaktualizowaniu plików możesz:
git status
Aby zobaczyć, które pliki zostały zmodyfikowane. Dodajesz te, które chcesz index
najpierw zatwierdzić ( index
przypomina listę do sprawdzenia):
git add .
lub
git add blah.c
Następnie git status
pokaże, które pliki zostały zmodyfikowane, a które są index
gotowe do zatwierdzenia lub zalogowania.
Aby zatwierdzić pliki w kopii repozytorium:
git commit -a -m "commit message here"
Zobacz git
stronę internetową zawierającą łącza do instrukcji i przewodników.
git format-patch
aby utworzyć łatkę do przesłania ( git format-patch -1
utworzy łatkę tylko ostatnie zatwierdzenie).
Oto kompletne rozwiązanie do pobierania i przesyłania tylko określonego pliku w repozytorium git:
git clone --no-checkout <git url>
git reset
git checkout origin/master <path to file>
git add <path to file>
git commit -m <message text>
git push
Zobacz także link, aby uzyskać dodatkowe informacje.
Wygląda na to, że próbujesz przenieść pomysł ze scentralizowanej kontroli wersji, której git z natury nie ma - jest rozpowszechniany. Jeśli chcesz pracować z repozytorium git, sklonuj je. Następnie masz całą zawartość drzewa roboczego i całą historię (cóż, przynajmniej wszystko prowadzące do końca bieżącej gałęzi), a nie tylko pojedynczy plik lub migawkę z pojedynczego zatwierdzenia.
git clone /path/to/repo
git clone git://url/of/repo
git clone http://url/of/repo
Jeśli potrzebujesz określonego pliku z określonej gałęzi ze zdalnego repozytorium Git, polecenie to:
git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -
Resztę można uzyskać z odpowiedzi @ VonC:
Jeśli potrzebujesz określonego pliku z gałęzi master, jest to:
git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -
Jeśli potrzebujesz określonego pliku z tagu, jest to:
git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -
Nie widzę tu, co dla mnie zadziałało, więc dołączę to, jeśli ktoś będzie w mojej sytuacji.
W mojej sytuacji mam zdalne repozytorium może z 10 000 plików i muszę zbudować plik RPM dla mojego systemu Linux. Kompilacja RPM zawiera git-klon wszystkiego. Potrzebuję tylko jednego pliku, aby rozpocząć kompilację RPM. Mogę sklonować całe drzewo źródłowe, które robi to, czego potrzebuję, ale pobranie wszystkich tych plików zajmuje dodatkowe dwie minuty, gdy wszystko, czego potrzebuję, to jeden. Próbowałem użyć omówionej opcji archiwum git i otrzymałem komunikat „Fatal: Operacja nie jest obsługiwana przez protokół”. Wygląda na to, że muszę włączyć opcję archiwizacji na serwerze, a mój serwer jest utrzymywany przez biurokratycznych bandytów, którzy wydają się lubić utrudnianie wykonywania zadań.
W końcu zrobiłem to, gdy wszedłem do interfejsu sieciowego dla bitbucket i przejrzałem jeden plik, którego potrzebowałem. Zrobiłem prawym przyciskiem myszy link, aby pobrać nieprzetworzoną kopię pliku i wybrałem „skrót do kopiowania” z wynikowego wyskakującego okienka. Nie mogłem po prostu pobrać nieprzetworzonego pliku, ponieważ musiałem zautomatyzować różne rzeczy i nie mam interfejsu przeglądarki na moim serwerze Linux.
Ze względu na dyskusję powstał adres URL:
https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest
Nie mogłem bezpośrednio pobrać tego pliku z repozytorium bitbucket, ponieważ najpierw musiałem się zalogować. Po krótkim kopaniu okazało się, że zadziałało: W systemie Linux:
echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=
curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec
Ta kombinacja pozwoliła mi pobrać jeden plik, którego potrzebowałem, aby zbudować wszystko inne.
Dodaję tę odpowiedź jako alternatywę dla formalnej kasy lub innej podobnej operacji lokalnej. Zakładając, że masz dostęp do interfejsu internetowego swojego dostawcy Git, możesz być w stanie bezpośrednio wyświetlić dowolny plik przy danym żądanym zatwierdzeniu. Na przykład w GitHub możesz użyć czegoś takiego:
https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee
Oto ed25584f
pierwsze 8 znaków z skrótu SHA-1 interesującego zatwierdzenia, a następnie ścieżka do pliku źródłowego.
Podobnie, na Bitbucket możemy wypróbować:
https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08
W takim przypadku umieszczamy skrót zatwierdzenia na końcu źródłowego adresu URL.
Jeśli potrzebujesz tylko pobrać plik, nie musisz sprawdzać w Git.
GitHub Mate jest o wiele łatwiejszy, jest to rozszerzenie do Chrome, umożliwia kliknięcie ikony pliku, aby go pobrać. także open source
git
! =github
Jeśli edytowałeś lokalną wersję pliku i chcesz przywrócić oryginalną wersję utrzymywaną na centralnym serwerze, możesz to łatwo osiągnąć za pomocą rozszerzeń Git .
Łatwy!